반응형
한겨례신문에 재미있는 기사가 올라왔다.
차세대 검색엔진 '인공지능'달아라
차세대 검색엔진은 1) 언어나 문맥의 이해, 2) 인공지능 탑재, 3)사진검색, 4)전문분야 검색 등으로 이루어질 것이라는 기사이다.
1) 언어나 문맥의 이해
지금의 검색엔진은 검색 대상 문서내에 포함된 언어학적 정보나 이를 기반으로 하는 의미까지 분석해 내지 못한다.
정확하게 말하면, 문장내에 포함된 의미를 식별하고 분석하기 위해서는 언어학적으로 잘 구축된 온톨로지나 시소러스 등을 이용한 구문분석 및 의미분석이 이루어져야 하는데, 실생활을 전부 포함할 수 있는 온톨로지의 구축은 실제로 거의 불가능하다.(돈이 많이 들지..)
그럼에도 불구하고 '잠실 근처의 안경점은?' 등과 같은 질의어를 처리할 수 있는 검색엔진이 나온다면, 검색엔진 패러다임을 완전히 바꿀 수 있기에, 사용자들이 한두단어로 이루어진 질의어보다 문장단위의 질의어를 입력하고 더 많은 의도를 표현해주기를 바라는 노력과 함께, 문장단위의 의미를 분석해내고 이를 검색결과에 반영하는 일은 이미 일부 분야를 기준으로 상용화 되고 있는 상황이다.
대표적으로 다음소프트의 애널라이저라는 솔루션이 있는데, 특정 분야에 한정하는 경우 대상의 의미까지 분석해서 이를 업무에 활용할 수 있도록 하는 솔루션이 이미 판매되고 있다고 한다.
2) 인공지능의 탑재
사실 무엇이든지 사람의 인지능력이나 사고, 판단능력을 재현해낼 수 있는 그 무언가가 나온다면, 뭐 게임 오버라고 할 수 있다. 인공지능의 주제는 넓고도 광활한데.. 좀 다른얘기를 해보면,
'미들웨어'로서의 인공지능이다.
인공지능의 여러가지 특징이 있겠지만, 앞으로 과도기적으로는 '미들웨어'로서의 그 무언가가가 인공지능의 흉내를 내지 않을까 하는 생각을 해본다.
WAS를 말하는 미들웨어가 아니라, 현재의 상황을 인식하고 인식된 상황정보를 바탕으로 현재의 생태를 정확하게 알고, 이를 가지고 추가 액션을 취하도록 해주는 그 무언가..
유비쿼터스의 대표라 하는 센서네트워크도 사실, 센싱한 결과만을 가지고 있는데, 이것은 단지 현재의 상황정보만을 모아놓은 것인데, 다음으로는 상황정보를 바탕으로 현재 어떤 상태고, 유저는 어떤 사람이고 하는 정보가 있어야만, 거기에 맞는 서비스나 컨텐츠를 제공할 수 있을 것이다.
3) 사진 검색
제일 관심많은 기술이다.
나만 해도 디카로 찍어놓은 사진이 거의 1000여장 가까이 된다.
이 사진을 윈도우즈의 탐색기를 통해서 미리보기를 해서 찾아보지 않으면, 내가 찾거나 원하는 사진을 찾을 방법이 없다. 즉, 한장한장 휴리스틱하게 찾아야 하는데,
사진의 캡션이나 이름이 아니라, 사진 자체를 검색할 수 있다면, 이 또한 놀라운 정보검색의 미답지가 정복되는 것이 아닌가하는 생각이 든다.
대학원때 옆 연구실이 이미지 랩이였는데, 거의 수학을 하고 있었다. 그리고, 이미지 랩의 사진이 아직도 생각나는데 모자쓴 어떤 여인네의 모습이였는데, 마치 미대 입시를 위해서 '아그립바' 입상을 두고 뎃생연습을 하듯이 그 여인네 사진을 가지고 필터링하고 인식하고 하는 것으로 보았는데..
음성인식이 저 멀리 있는 거처럼
이미지인식도 아직 저 멀리 있는 것 같다. -_-
거의 10여년전 일이니, 지금은 더 많이 인식할지도..
4) 전문분야 검색
검색이 언어의 표현인 문자로 이루어진 문서를 대상으로 하다보니, 전문분야에 한정되어 또는 다르게 사용되는 의미의 단어나 표현들이 존재한다. 이를 검색할 수 있도록 색인구조를 전문화하고 결과를 최적화한다면, 확실히 좋은 검색결과를 제공할 수 있다.
하지만, 이를 구축하기 위해서는 거의 웹검색을 할 수 있을 만큼의 인프라가 필요한데, 이것이 돈이다 보니, 아직 국내에서는 가격비교검색 이외에는 전문화된 검색이 없다.
예를 들어, 온라인 서점별로 가격을 비교할 수 있게 한다든지, 전국대학의 도서관과 연계하여 도서나 논문 검색을 전문화한다든지 하면, 얼마든지 이용할 수 있을 것 같다.
예전에는 있었는데, 사라진 옵션 중 하나인 파일 검색 기능이라든지..(음, 이거는 전문분야가 아니잖아..., 쓰뤠기..-_-)
이상의 특징외에도, 대화를 이용한 검색 이라든지 음성인식을 이용한 검색이라든지 다양한 차세대 검색엔진의 특징들이 앞으로 많은 연구개발을 통해서 서비스 될 수 있으면 좋을 것 같다.
차세대 검색엔진 '인공지능'달아라
[출처 : 한겨레신문]
1) 언어나 문맥의 이해
지금의 검색엔진은 검색 대상 문서내에 포함된 언어학적 정보나 이를 기반으로 하는 의미까지 분석해 내지 못한다.
정확하게 말하면, 문장내에 포함된 의미를 식별하고 분석하기 위해서는 언어학적으로 잘 구축된 온톨로지나 시소러스 등을 이용한 구문분석 및 의미분석이 이루어져야 하는데, 실생활을 전부 포함할 수 있는 온톨로지의 구축은 실제로 거의 불가능하다.(돈이 많이 들지..)
그럼에도 불구하고 '잠실 근처의 안경점은?' 등과 같은 질의어를 처리할 수 있는 검색엔진이 나온다면, 검색엔진 패러다임을 완전히 바꿀 수 있기에, 사용자들이 한두단어로 이루어진 질의어보다 문장단위의 질의어를 입력하고 더 많은 의도를 표현해주기를 바라는 노력과 함께, 문장단위의 의미를 분석해내고 이를 검색결과에 반영하는 일은 이미 일부 분야를 기준으로 상용화 되고 있는 상황이다.
대표적으로 다음소프트의 애널라이저라는 솔루션이 있는데, 특정 분야에 한정하는 경우 대상의 의미까지 분석해서 이를 업무에 활용할 수 있도록 하는 솔루션이 이미 판매되고 있다고 한다.
2) 인공지능의 탑재
사실 무엇이든지 사람의 인지능력이나 사고, 판단능력을 재현해낼 수 있는 그 무언가가 나온다면, 뭐 게임 오버라고 할 수 있다. 인공지능의 주제는 넓고도 광활한데.. 좀 다른얘기를 해보면,
'미들웨어'로서의 인공지능이다.
인공지능의 여러가지 특징이 있겠지만, 앞으로 과도기적으로는 '미들웨어'로서의 그 무언가가가 인공지능의 흉내를 내지 않을까 하는 생각을 해본다.
WAS를 말하는 미들웨어가 아니라, 현재의 상황을 인식하고 인식된 상황정보를 바탕으로 현재의 생태를 정확하게 알고, 이를 가지고 추가 액션을 취하도록 해주는 그 무언가..
유비쿼터스의 대표라 하는 센서네트워크도 사실, 센싱한 결과만을 가지고 있는데, 이것은 단지 현재의 상황정보만을 모아놓은 것인데, 다음으로는 상황정보를 바탕으로 현재 어떤 상태고, 유저는 어떤 사람이고 하는 정보가 있어야만, 거기에 맞는 서비스나 컨텐츠를 제공할 수 있을 것이다.
3) 사진 검색
제일 관심많은 기술이다.
나만 해도 디카로 찍어놓은 사진이 거의 1000여장 가까이 된다.
이 사진을 윈도우즈의 탐색기를 통해서 미리보기를 해서 찾아보지 않으면, 내가 찾거나 원하는 사진을 찾을 방법이 없다. 즉, 한장한장 휴리스틱하게 찾아야 하는데,
사진의 캡션이나 이름이 아니라, 사진 자체를 검색할 수 있다면, 이 또한 놀라운 정보검색의 미답지가 정복되는 것이 아닌가하는 생각이 든다.
대학원때 옆 연구실이 이미지 랩이였는데, 거의 수학을 하고 있었다. 그리고, 이미지 랩의 사진이 아직도 생각나는데 모자쓴 어떤 여인네의 모습이였는데, 마치 미대 입시를 위해서 '아그립바' 입상을 두고 뎃생연습을 하듯이 그 여인네 사진을 가지고 필터링하고 인식하고 하는 것으로 보았는데..
음성인식이 저 멀리 있는 거처럼
이미지인식도 아직 저 멀리 있는 것 같다. -_-
거의 10여년전 일이니, 지금은 더 많이 인식할지도..
4) 전문분야 검색
검색이 언어의 표현인 문자로 이루어진 문서를 대상으로 하다보니, 전문분야에 한정되어 또는 다르게 사용되는 의미의 단어나 표현들이 존재한다. 이를 검색할 수 있도록 색인구조를 전문화하고 결과를 최적화한다면, 확실히 좋은 검색결과를 제공할 수 있다.
하지만, 이를 구축하기 위해서는 거의 웹검색을 할 수 있을 만큼의 인프라가 필요한데, 이것이 돈이다 보니, 아직 국내에서는 가격비교검색 이외에는 전문화된 검색이 없다.
예를 들어, 온라인 서점별로 가격을 비교할 수 있게 한다든지, 전국대학의 도서관과 연계하여 도서나 논문 검색을 전문화한다든지 하면, 얼마든지 이용할 수 있을 것 같다.
예전에는 있었는데, 사라진 옵션 중 하나인 파일 검색 기능이라든지..(음, 이거는 전문분야가 아니잖아..., 쓰뤠기..-_-)
이상의 특징외에도, 대화를 이용한 검색 이라든지 음성인식을 이용한 검색이라든지 다양한 차세대 검색엔진의 특징들이 앞으로 많은 연구개발을 통해서 서비스 될 수 있으면 좋을 것 같다.
반응형
'Technology' 카테고리의 다른 글
5대 홈쇼핑 검색엔진 비교평가 (0) | 2007.04.29 |
---|---|
개인의 검색역사를 남기는 이유? (0) | 2007.04.21 |
의미검색 (0) | 2007.04.17 |
음성인식 검색기술! (0) | 2007.03.20 |
검색도 미케니컬 터크(Mechanical Turk)? (0) | 2007.03.02 |
검색서비스에서 가장 중요한 것은 무엇인가요? (2) | 2007.02.06 |
C2 마이베이스에 대한 짧은 생각 (0) | 2007.01.31 |
유선검색과 무선검색? (2) | 2007.01.30 |