반응형
검색엔진의 성능요소
검색엔진의 성능요소를 생각해보면, 색인과 관련해서 색인 속도와 색인의 크기와 관련된 부분이 있고, 검색결과를 색인에서 뽑은 뒤에 화면에 정렬하여 제공하기 위한 랭킹을 결정하는 부분(정확도와 관련된)에 재현율 정도로 볼 수 있다.
'개인 검색 역사까지 남기려는 구글'이라는 이희욱님의 글을 보면서, 구글에서 이제 웹 문서의 형태로부터 링크 정보(얼마나 많은 링크가 이 문서를 가리키는지)를 분석하여 검색결과에 활용하는 페이지랭크 기법에 추가로 사용자의 검색 사용 기록을 검색결과에 할용하려고 하는 것 같다.
사용자의 검색 사용 기록, 검색 역사
사용자가 어떤 질의어를 입력했고, 결과 중에서 어떤 결과를 선택했었다는 브라우징 결과까지 안다면, 인구통계학적 정보가 있다면 좋겠지만, 없더라도, 페이지 랭크만한 효과를 기대할 수 있다.
동일한 '질의어'를 입력했던 사용자들이 가장 많이 선택했던 결과가 가장 정확한 결과이다. 결국, 가장 많이 링크가 걸려있는 웹 문서에 가중치를 두는 페이지랭크의 개념과 유사한 개념으로 보여진다.
집단지성? 협업?
우선, 로그인기반의 검색서비스를 이용할만큼의 동인(動因)을 제공할 수 있는지가 성공여부일 것 같다. 로그인을 해서 주로 구글을 사용한다면, 뭐 간단하게 해결될 문제이지만, 아마도 이 정보를 전체적인 서비스에 활용하려면 추가적인 사용자의 동의를 얻는 것이 관건이 될 것이다. 뭐 그만한 가치가 있는지.. 잘 모르겠다.
북마크를 공유해서 수많은 웹 사이트에 대한 가중치를 줄 수 있다든지(많은 사람이 특정 카테고리로 어떤 웹 사이트를 북마크한다면, 그만큼 가치있는 웹 사이트라는 추정이 가능할 것)하는 식의 집단지성의 한 형태로 보여지기도 한다.
아니면 미케니컬 터크인가? 사용자는 모르는
아님 협업인가? 사용자가 역시 모르는
아무튼, 사용자의 경험이라는 것은 어떤 식으로 든지 활용가능성이 무궁무진한 가치있는 정보인 것은 확실하기에 이러한 시도가 정보검색의 새로운 패러다임이 될 수는 없어도, 기존 검색결과에 부가 가치를 제공할 수 있을 것 같다.
검색엔진의 성능요소를 생각해보면, 색인과 관련해서 색인 속도와 색인의 크기와 관련된 부분이 있고, 검색결과를 색인에서 뽑은 뒤에 화면에 정렬하여 제공하기 위한 랭킹을 결정하는 부분(정확도와 관련된)에 재현율 정도로 볼 수 있다.
'개인 검색 역사까지 남기려는 구글'이라는 이희욱님의 글을 보면서, 구글에서 이제 웹 문서의 형태로부터 링크 정보(얼마나 많은 링크가 이 문서를 가리키는지)를 분석하여 검색결과에 활용하는 페이지랭크 기법에 추가로 사용자의 검색 사용 기록을 검색결과에 할용하려고 하는 것 같다.
사용자의 검색 사용 기록, 검색 역사
사용자가 어떤 질의어를 입력했고, 결과 중에서 어떤 결과를 선택했었다는 브라우징 결과까지 안다면, 인구통계학적 정보가 있다면 좋겠지만, 없더라도, 페이지 랭크만한 효과를 기대할 수 있다.
동일한 '질의어'를 입력했던 사용자들이 가장 많이 선택했던 결과가 가장 정확한 결과이다. 결국, 가장 많이 링크가 걸려있는 웹 문서에 가중치를 두는 페이지랭크의 개념과 유사한 개념으로 보여진다.
집단지성? 협업?
우선, 로그인기반의 검색서비스를 이용할만큼의 동인(動因)을 제공할 수 있는지가 성공여부일 것 같다. 로그인을 해서 주로 구글을 사용한다면, 뭐 간단하게 해결될 문제이지만, 아마도 이 정보를 전체적인 서비스에 활용하려면 추가적인 사용자의 동의를 얻는 것이 관건이 될 것이다. 뭐 그만한 가치가 있는지.. 잘 모르겠다.
북마크를 공유해서 수많은 웹 사이트에 대한 가중치를 줄 수 있다든지(많은 사람이 특정 카테고리로 어떤 웹 사이트를 북마크한다면, 그만큼 가치있는 웹 사이트라는 추정이 가능할 것)하는 식의 집단지성의 한 형태로 보여지기도 한다.
아니면 미케니컬 터크인가? 사용자는 모르는
아님 협업인가? 사용자가 역시 모르는
아무튼, 사용자의 경험이라는 것은 어떤 식으로 든지 활용가능성이 무궁무진한 가치있는 정보인 것은 확실하기에 이러한 시도가 정보검색의 새로운 패러다임이 될 수는 없어도, 기존 검색결과에 부가 가치를 제공할 수 있을 것 같다.
반응형
'Technology' 카테고리의 다른 글
검색엔진 성능평가 (0) | 2007.06.05 |
---|---|
검색결과의 Visualization (0) | 2007.05.31 |
앞으로 예상되는 검색서비스 (0) | 2007.05.12 |
5대 홈쇼핑 검색엔진 비교평가 (0) | 2007.04.29 |
의미검색 (0) | 2007.04.17 |
음성인식 검색기술! (0) | 2007.03.20 |
차세대 검색엔진의 특징 (0) | 2007.03.12 |
검색도 미케니컬 터크(Mechanical Turk)? (0) | 2007.03.02 |