본문 바로가기
Technology

동영상검색서비스, Enswer.net

by 마루날 2008. 9. 29.
반응형
Enswer.net

지난 토요일(9/27) 보라매공원 앞 KTH 대회의실에서 스마트플레이스에서 주관하고 KTH가 스폰서한 7회 데모데이 행사가 있었다. 원래 IT업계의 블로거들의 네트워킹과 이슈에 대한 토론을 위한 IT난상토론회가 새로운 모습으로 업그레이드한 행사였다.

개인적으로 검색과 SNS에 관심이 있어서 참가를 하게 되었는데, 동영상 검색에 대한 새로운 가능성과 함께 기술의 한계를 함께 느낄 수 있는 시간이었다.

이름은 Entertatiinment + search의 의미로 Enswer라고 지었다고 한다.
사용자 삽입 이미지

[엔써즈의 과거]

사용자 삽입 이미지

[엔써즈의 현재]

서버를 조립PC써서 사용하는 거 보니.. 옛날 생각난다. T.T

Enswer.net은 현재 클로즈드 베타 서비스 중이다. 신청하고 한 3일정도 있으면 컨펌메일이 오더라

구글 비디오 검색과 경쟁하겠다는 엔써즈의 인력구성을 보면서 요즘처럼 인력 구하기 힘든 시기에 정말 대단한 분들이 모였구나 하는 생각을 하게 된다.
사용자 삽입 이미지

[앤써즈 목표]

사용자 삽입 이미지

[앤써즈 ]



동영상 검색의 한계

UCC라는 것은 동영상과 동의어로 여겨질 만큼 앞으로 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아질 것이다. 데이터가 쌓이면 검색을 해야 하는 것이 당연하기때문에 동영상 검색에 대한 필요성은 두말하면 잔소리이다.

이렇게 중요한 동영상 검색에도 몇 가지 치명적인 문제점이 있는데, 1)중복, 2)제목과 내용이 일치하지 않음, 3)저작권 침해 등이다.
01234


Enswer.net의 해결방안

앤써즈의 해결방안은 한마디로 동영상 클러스터링이다.

텍스트 문서의 클러스터링과 달리 앤써즈는 동영상이라는 것이 결국 30프레임이나 10프레임 등으로 구성된 스틸이미지의 연속에 불과하기 때문에, 스틸이미지를 비교해서 중복여부를 판단한다고 한다.

기존의 이미지 비교는 원본과 사본의 차이를 구분하는 방식의 기술이 대부분이었는데, 앤써즈에서는 서로 다른 두 이미지의 유사도여부를 판단하는 식으로 기술을 개발하여서 그 정확도가 매우 높다고 한다.
01234567

위에서 언급했던 동영상 검색의 문제를 어떻게 해결했냐 하면

10초이상 겹치는 영상을 묶어서 클러스터를 만든다음 중복되거나 겹치는 동영상을 업로드된 시간을 기준으로 해서 가장 최초의 올라온 동영상을 원본으로 가정하고 나머지를 시간순으로 보여준다.

단순히 업로드된 시간 순으로만 보여지는 것이 아니라 해당 동영상의 어느 부분부터 겹치는지를 같이 제공하고 있어서 사용자에게 편리한 검색결과를 제공하고 있다.

또한, 클러스터링된 동영상의 메타 정보를 모두 활용하여 정확한 동영상 정보를 색인하여 검색결과의 정확도를 제고하고 있다.

이렇게 해서 기본적으로 중복문제를 해결 할 수 있고, 제목과 영상이 일치하지 않는 것도 걸러내기 쉽고, 무엇보다 시간순으로 정렬이 되고 장면단위로 구분이 가능하기에 저작권이 걸려있는 시리즈물에 대한 모니터링도 가능하다.


앤써즈의 수익모델은?

아직은 뚜렷한 수익모델은 없다. 동영상 검색서비스가 활성화되어 트래픽이 일어나면 이를 가지고 광고 플랫폼으로 활용하려고 하는 것이 전부인데 사용자들이 굳이 'Enswer.net'에서 동영상 검색을 해야 하는 이유가 명확하다면 그만한 트래픽을 보장하겠지만 현재까지 사용해 본 서비스에 대해서는 조금 의구심이 남아있다.
01234


그렇다면...

우선 동영상 검색의 당장의 문제점들인 중보이나 겹치는 문제를 해결한 것은 매우 뛰어난 기술력 때문이라고 보여진다. 하지만, 동영상 검색이라고 하는 서비스의 목표를 생각해보면 검색에 대해서는 그다지 차이점을 볼 수 없었다.

1) 정확도

만약에 구글이나 네이버에서 동영상에 대한 클러스터링을 적용해서 중복 영상에 대하여 해결하면 결국은 동영상의 메타정보를 활용하는 것은 똑같은데 베타서비스를 이용해보면 검색결과를 뽑아내는 랭킹에 대한 부분은 아직 메타 정보에 최적화된 방식이라고 보여지지 않는다.

처음 사용해보면 매우 정확해 보이지만, 자꾸 사용하다보면 깔끔하기는 하지만 여전히 키워드 검색에 불과하다는 것이다.

2) 재현율?

현재 3500만건의 동영상을 색인하고 있다고 하는데, 인터넷에 올라오는 모든 동영상까지는 아니라고 해도 얼마나 많은 동영상을 색인 할 수 있을지에 대해서 의구심이 든다.

스틸이미지 자체에 대한 의미를 검색할 수 있기에는 현존하는 기술로는 상용화하기에 거의 불가능하다고 알고 있는데, 또 한번 확인했던 자리인것 같다.

그렇지만, 100대 정도의 조립 PC를 가지고 이정도의 서비스를 제공할 수 있는 앤써즈의 기술력을 높이 평가하고 앞으로는 '검색'이라는 부분도 좀 더 신경써서 더 나은 서비스가 되기를 바란다.

검색은 사용자의 Mind를 Read하는 것이라는 사장님의 말씀이 귀에 남는다. ^^



 마루날의 雜學辭典(잡학사전)을 RSS리더로 편하게 구독해서 보세요~

반응형