반응형
이 질문은 어떤 미팅에서 들었던 질문이다.
검색의 성능요소
검색엔진 자체를 포함해서 검색서비스의 성능요소는 무엇일까?
검색엔진의 성능요소라고 하면, '정확한 검색결과를 제공하는 것'이 목표라고 전제한다면, 정확도와 재현율이라는 요소를 생각해 볼 수 있을 것이다. 이 정확도와 재현율에 가장 큰 영향을 주는 것은 검색엔진의 모델이라고 할 수 있다.
블리언, 벡터스페이스, 확률, 확장 불리언 등등의 다양한 검색모델이 존재하고, 검색엔진 회사마다 고유의 모델이 있을텐데, 결국 이 모델이 어떠하야고 검색결과의 많은 영향을 주게되고, 이 모델에 따라서 색인구조를 어떻게 가져갈지를 정하게 되과, 색인구조에 따라서 색인기법이 영향을 받게 된다.
또 하나를 생각해 보면, 검색결과를 정렬하는 알고리즘일것이다. 페이지랭크니, 스노우랭크니 복잡한 알고리즘이 있지만, 가장 기본적인 것이 문서에 색인어의 출현한 빈도, 위치 등의 정보를 어떻게 검색결과에서 반영할지를 결정하는 정렬 알고리즘이 중요하다고 할 수 있다. 이 정렬 알고리즘은 또 색인구조와 검색모델과도 밀접한 관계가 있다
검색기술만 확보하면 되겠네~
위에서 언급한 내용들을 위해서 언어처리 기술, 대용량 데이터 저장 및 처리 기술, 색인 기술 등의 각종 핵심적인 요소 기술들이 필요한데, 이 기술은 단시간에 습득되지 않고, 단기간에 성능이 향상되지 않는 특징을 가지고 있다.
그러다보니, 검색엔진 연구개발인력의 양성이 쉽게 이루어지지 않고, 지속적인 연구개발에 투자하기가 회사 입장에서도 쉽지 않다.
그리고, 사용자에게 보여지는 것이 오직 검색결과이다보니, 성능의 향상이나 기능의 개선이 쉽게 보이지 않고, 이러다 보니, 그놈이 그놈 아니냐는 얘기까지 듣게 된다.
그러함에도 불구하고, 검색엔진을 위한 기술만 확보하면, 제대로된 서비스를 할 수 있을 것 같지만, 개인적으로 '제목'의 질문에 대한 답변이기도 하지만, 기술이 전부가 아니다.
검색서비스의 가장 중요한 것은 기획 및 운영인력이다.
확보된 기술이 없다면 말짱 도루묵이지만, 기술이 있다고 가정한다면, 서비스를 기획하고 운영하는 인력이 제일 중요하다고 생각된다.
기획이라고 하면, 대충 UI 정도를 생각하는데, 물론 UI도 포함되지만, 검색서비스의 기획이라고 하면, 어떤 정보를 어떻게 수집해서 어떻게 사용자에게 제공할지에 대하여 포괄적으로 이해하고, 그림을 그릴 수 있어야 한다.
사용자가 원하는 검색에 대한 요구를 식별하고 분석해서 필요한 결과를 제공하기 위해서 어떤 기술을 어떻게 적용하면 좋을 지에 대한 서비스 전반에 대한 기획능력이 매우 중요하다.
검색기획자가 회사마다 귀한것은, 검색엔진 기술에 대한 깊이 있는 이해와 함께, 사용자에 대한 이해가 풍부한 사람이 드물기 때문이다. 마치, 한시즌 앞의 트랜드를 미리 읽고 쇼를 준비하는 디자이너와 같다고 할 수 있다.
운영인력은 단순히 시스템을 운영하는 사람들뿐만 아니라, 다양하게 쏟아져 들어오는 사용자의 질의어를 분석하고 대응할 수 있는 능력을 보유한 사람들을 말한다.
어쩌면 이것이 한국형 검색서비스의 현주소인지도 모른다.
철저하게 사람에 의해서 만들어진 검색결과는 결국 이런 기획이나 운용으로 떼우는 결과를 만들어 낸것일 수 도 있지만, 검색서비스도 어차피 비즈니스라면, 그리고 트래픽을 모아쥐고 있는 것이 승부의 촛점이라면, 철저하게 기획 및 운영 인력을 확보하고 그러한 능력을 축적하는 것이 서비스의 성패를 좌우할 것이다.
검색의 성능요소
검색엔진 자체를 포함해서 검색서비스의 성능요소는 무엇일까?
검색엔진의 성능요소라고 하면, '정확한 검색결과를 제공하는 것'이 목표라고 전제한다면, 정확도와 재현율이라는 요소를 생각해 볼 수 있을 것이다. 이 정확도와 재현율에 가장 큰 영향을 주는 것은 검색엔진의 모델이라고 할 수 있다.
블리언, 벡터스페이스, 확률, 확장 불리언 등등의 다양한 검색모델이 존재하고, 검색엔진 회사마다 고유의 모델이 있을텐데, 결국 이 모델이 어떠하야고 검색결과의 많은 영향을 주게되고, 이 모델에 따라서 색인구조를 어떻게 가져갈지를 정하게 되과, 색인구조에 따라서 색인기법이 영향을 받게 된다.
또 하나를 생각해 보면, 검색결과를 정렬하는 알고리즘일것이다. 페이지랭크니, 스노우랭크니 복잡한 알고리즘이 있지만, 가장 기본적인 것이 문서에 색인어의 출현한 빈도, 위치 등의 정보를 어떻게 검색결과에서 반영할지를 결정하는 정렬 알고리즘이 중요하다고 할 수 있다. 이 정렬 알고리즘은 또 색인구조와 검색모델과도 밀접한 관계가 있다
검색기술만 확보하면 되겠네~
위에서 언급한 내용들을 위해서 언어처리 기술, 대용량 데이터 저장 및 처리 기술, 색인 기술 등의 각종 핵심적인 요소 기술들이 필요한데, 이 기술은 단시간에 습득되지 않고, 단기간에 성능이 향상되지 않는 특징을 가지고 있다.
그러다보니, 검색엔진 연구개발인력의 양성이 쉽게 이루어지지 않고, 지속적인 연구개발에 투자하기가 회사 입장에서도 쉽지 않다.
그리고, 사용자에게 보여지는 것이 오직 검색결과이다보니, 성능의 향상이나 기능의 개선이 쉽게 보이지 않고, 이러다 보니, 그놈이 그놈 아니냐는 얘기까지 듣게 된다.
그러함에도 불구하고, 검색엔진을 위한 기술만 확보하면, 제대로된 서비스를 할 수 있을 것 같지만, 개인적으로 '제목'의 질문에 대한 답변이기도 하지만, 기술이 전부가 아니다.
검색서비스의 가장 중요한 것은 기획 및 운영인력이다.
확보된 기술이 없다면 말짱 도루묵이지만, 기술이 있다고 가정한다면, 서비스를 기획하고 운영하는 인력이 제일 중요하다고 생각된다.
기획이라고 하면, 대충 UI 정도를 생각하는데, 물론 UI도 포함되지만, 검색서비스의 기획이라고 하면, 어떤 정보를 어떻게 수집해서 어떻게 사용자에게 제공할지에 대하여 포괄적으로 이해하고, 그림을 그릴 수 있어야 한다.
사용자가 원하는 검색에 대한 요구를 식별하고 분석해서 필요한 결과를 제공하기 위해서 어떤 기술을 어떻게 적용하면 좋을 지에 대한 서비스 전반에 대한 기획능력이 매우 중요하다.
검색기획자가 회사마다 귀한것은, 검색엔진 기술에 대한 깊이 있는 이해와 함께, 사용자에 대한 이해가 풍부한 사람이 드물기 때문이다. 마치, 한시즌 앞의 트랜드를 미리 읽고 쇼를 준비하는 디자이너와 같다고 할 수 있다.
운영인력은 단순히 시스템을 운영하는 사람들뿐만 아니라, 다양하게 쏟아져 들어오는 사용자의 질의어를 분석하고 대응할 수 있는 능력을 보유한 사람들을 말한다.
어쩌면 이것이 한국형 검색서비스의 현주소인지도 모른다.
철저하게 사람에 의해서 만들어진 검색결과는 결국 이런 기획이나 운용으로 떼우는 결과를 만들어 낸것일 수 도 있지만, 검색서비스도 어차피 비즈니스라면, 그리고 트래픽을 모아쥐고 있는 것이 승부의 촛점이라면, 철저하게 기획 및 운영 인력을 확보하고 그러한 능력을 축적하는 것이 서비스의 성패를 좌우할 것이다.
반응형
'Technology' 카테고리의 다른 글
의미검색 (0) | 2007.04.17 |
---|---|
음성인식 검색기술! (0) | 2007.03.20 |
차세대 검색엔진의 특징 (0) | 2007.03.12 |
검색도 미케니컬 터크(Mechanical Turk)? (0) | 2007.03.02 |
C2 마이베이스에 대한 짧은 생각 (0) | 2007.01.31 |
유선검색과 무선검색? (2) | 2007.01.30 |
검색엔진과 SN (2) | 2007.01.26 |
검색... 이상계의 절대반지 (0) | 2007.01.25 |