본문 바로가기
Technology

스도쿠 문서검색

by 마루날 2008. 5. 20.
반응형
스도쿠 문서검색(http://sdocu.synap.co.kr)

스도쿠 ?
가로 9칸, 세로 9칸으로된 사각형에 1부터 9까지의 숫자를 채워 넣는 퍼즐을 말하는 건가?

아마도 문서검색을 의미하는 Search Documents에서 따온 sdocu를 서비스 이름으로 사용하는 것 같은데,  사이냅소프트[각주:1]에서 제공하는 문서검색 서비스이다.
사용자 삽입 이미지


사용해보니...

검색을 해보면 질의어에 해당하는 문서를 찾아서 결과로 제공하고 있다.
사용자 삽입 이미지

검색결과에서 HTML로 보기를 누르면, 다음과 같은 창이 pop-up된다.
사용자 삽입 이미지

HTML보기를 통해서 현재 지원하고 있는 문서의 포맷은 MS-Office파일, HWP,  PDF 이다.

문서검색은 결국 내가 필요한 정보를 이 문서가 가지고 있는지가 관건인데, 이럴때 문서필터를 통해서 HTML로 미리 볼 수 있다는 것은 매우 유용한 서비스이다. 다만, 모든 문서에 대해서 제공하지 않는 것은 정책적인 이슈인 듯 하다.

그리고 대용량이라고 하기에는 아직 수집하여 갖고 있는 문서의 량이 많지 않아 보인다. 검색결과에 중국어나 일본어까지 나오는 것은 글로벌하게 검색서비스를 제공한다는 의도일 수 있지만, 안그래도 적은 한글문서가 더 적어보인다.

향후 다양한 검색옵션에서 다국어 또는 찾고자 하는 대상 언어를 선택할 수 있는 기능이 포함되기를 기대해 본다.

검색결과를 보면 복합명사나 띄어쓰기 또는 복수개의 질의어에 대한 처리가 아직은 미숙해 보이는데, 향후에 반영이 될 것으로 보여진다.

문서검색을 할 때 중요한 기술 이슈 중 하나인 유사문서 또는 동일문서에 대한 구분을 해주었으면 한다. 가능하다면 클러스터링 기술을 적용해서 검색결과를 보여준다면 좋겠다.


그렇다면...

문서검색이라는 것은 새로운 서비스는 아니다. 몇 년 전까지 네이버에서도 제공했던 서비스이다. 어느 순간 보이지 않았는데, 최근에  야후코리아에서 비즈니스 검색이라는 것을 론칭하면서 문서검색을 가지고 나왔다.

왜 이 시점에 문서검색일까?

문서양식을 찾기 위해서 ?
신뢰할 수 있는 정보를 찾기 위해서 ?
문서를 쉽게 얻을 수 있게 하기 위해서 ?

퍼 나른 정보가 전체의 70%를 차지한다는 우리나라의 현실에서 업무나 조사를 위해서 필요한 것은 신뢰할 수 있는 정보를 정확하게 찾을 수 있어야 하는 것이고, 이를 위해서는 우리나라 현실에서는 문서를 찾는 것이 1차적인 목표가 되기 때문에 문서검색을 시도하는 것으로 보여진다.

물론 검색이 네티즌들의 Toy가 되어버린지 오래되어서 문서검색처럼 Tool로서 기능하는 검색서비스에 대한 시장은 아직 그렇게 크지 않을 것이다.

하지만, 장난감으로 업무나 학업, 연구 등의 작업을 할 수는 없기 때문에 결국 유용한 도구로서의 검색엔진의 가치가 중요한 기준이 다시 될 것으로 예상되기에 이러한 시도가 전체 검색엔진 서비스의 질의 향상과 변화의 시작이 될 수 있기를 바란다.



 마루날의 雜學辭典을 구독하세요~

  1. 사이냅소프트라는 회사 이름을 들어본 적이 있는가? 최근에 야근을 못하게 하는 회사로 유명해졌지만, 검색엔진 업체나 포털 사이트에 근무한 분들은 이 업체의 주력 제품 중 하나인 문서 필터를 사용할 것이다. [본문으로]
반응형