본문 바로가기
Technology

MS 파워셋 인수

by 마루날 2008. 6. 27.
반응형
MS가 파워셋을 인수한다고?

관련기사 : "MS, 자연어 검색 '파워셋' 인수 추진"

한참 야후에 추파를 던지던 MS가 파워셋을 인수한다는 보도가 나왔다. MS가 몇년전부터 인터넷 사업전략을 수정하면서 북유럽 출신의 검색엔진 전문업체였던 'FAST'를 인수하는 등 검색기술 확보에 사운을 걸었다 싶을 만큼 인수합병에 적극 나서고 있다.

검색엔진 기술이라는 것은 일정수준까지는 진입장벽이 거의 없다 싶을 만큼 기술자체가 어렵다기 보다는 축적된 연구개발 성과에서 새롭고 개선된 엔진을 만들 수 있는 성격의 기술이다.

어느날 갑자기 검색엔진의 강자가 되고 싶다면, MS로서는 남아도는 현금을 쏟아부어서 전문기업을 사들이는 것이 어쩌면 해결책이 될 수 있다.


왜 파워셋인가?

잘 알려진대로 파워셋은 자연어검색을 표방하는 업체이다. 이미 ask.com이나 hakia.com과 같은 유사한 성격의 업체가 있는데도 파워셋을 선택한 것은 파워셋의 자산이 큰 영향을 준것은 아닌가 싶다.
사용자 삽입 이미지

파워셋은 2005년에 창립하였고, 2007년 2월, PARC(Palo Alto Research Center, Inc.  - 구 Xerox PARC)로부터 NLP 관련 특허, 원천기술, 인력 추가 확보하였다.[각주:1]

파워셋의 서비스 목표는 다음과 같다.
 - 대량의 컨텐츠로부터 의미 정보를 추출하는 것
 - 추출된 의미정보간의 관계를 매핑(Relation 규명)하는 것
 - 추출된 의미정보의 가치 평가

파워셋이 가지고 있는(있다고 주장하는)기술은 자연언어처리 기술( 형태소/구문/의미 분석 등), 의미사전 구축 기술(Ontology, Topic Map 등), 인공지능 기술(추론, 판단, 학습 등) 등이다.

자연어 질의어 문장 처리 가능 (e.g. Who did IBM acquire in 2003? )한 상태인데, 단순 Term Matching이 아닌 자연어처리로 정확도를 높이는 방식이다.

하지만, 사용자의 질의어로부터 충분한 정보를 얻지 못하면, 검색결과가 기존 검색엔진과 차이가 없다. 기존의 Ask.com 과 같은 자연어 검색엔진과 유사한 성능으로 보여지는데, 상용화 수준의 추론엔진이 결합된다면, 검색엔진의 패러다임을 바꿀 수 있을 것으로 보여진다.


그렇다면...


hakia.com이나 ask.com 같은 사이트처럼 2003년에 IBM이 인수한 회사에 대한 정보를 알고 싶다면 일반적으로 'IBM', '인수', '2003' 정도의 키워드를 묶어서 검색을 해본다. 실제로 이렇게 키워드를 입력한 경우 대부분의 검색엔진에서 정확한 검색결과를 기대하기는 어렵다.

구문관계나 질의어 문장에 대한 이해(?)를 바탕으로 검색을 하다보니, 구글과 같은 키워드 검색보다 정확한 검색결과를 제공할 수 있고, 앞으로는 이러한 자연어검색이 대세가 될 것이라고 파워셋은 주장한다.

자연어검색은 사용자의 정보요구를 명확히 할 수록 정보를 잘 찾아 줄 수 있다고 하는 컨셉에서 출발했다고 볼 수 있다. 자연어검색이라고 하면 우리나라는 이미 엠파스 등에서 써먹은(?) 한물간 기술로 생각할 수 있지만, 국내에서 실제로 자연어검색을 특정 도메인이 아닌 Public Domain을 대상으로 제공하는 서비스는 없다고 해도 과언이 아니다.

앞으로 진부하지만 좀 더 나은 검색엔진을 위해 자연어 질의어를 처리할 수 있는 검색이 등장할 수 있으면 좋겠다.



 마루날의 雜學辭典을 구독하세요~

  1. 개인적으로 이 부분이 MS에게 크게 어필하지 않았을까 싶다. 외국인 투자자들을 만나보면 IP(Intellectual property)에 대해서는 기본적으로 체크를 한다. [본문으로]
반응형