본문 바로가기

MSP/Project P

차세대 검색 [시멘틱 검색 기술]

시멘틱 웹 기술이란?
시멘틱 웹 기술은 사람의 머리 속에 있는 언어에 대한 이해를 컴퓨터 언어로 표현하고 이것을 컴퓨터가 사용할 수 있게 만드는 것이다. 시멘틱 웹에 기반한 검색은 기존키워드 기반의 정확한 문서 검색이 아니라 온톨로지Relation 기반의 개념적 검색 기술이다.


그럼 온톨로지(Ontology)란 무엇인가?
사람들이 사물에 대해 생각하는 바를 추상화하고 공유한 모델로, 정형화되어 있고 개념의 타입이나 사용상의 제약 조건들이 명시적으로 정의된 기술을 말한다. 사람들은 세상에 있는 사물이나 사건들을 경험하면서 그 속에 들어있는 특징들을 파악하면서 언어로 개념화한다고 한다. 이처럼 컴퓨터에서도 사람이 가지는 개념을 데이터베이스 형태로 만들어 사람이 생각하는 것과 비슷한 결과물을 만들어 내는 것을 온톨로지 기술이라고 부른다.


더욱 인공지능화 된 시멘틱 검색이 이론적으로 잘 구현된다면 검색이 매우 편리해 질 것 같다. 그럼 키워드 기반의 검색 포털들이 즐비해 있는 인터넷 시장에서 기술 발전 중인 국내 시멘틱 검색 엔진을 살펴보자.


시멘틱스의 큐로보(Qrobo)

메인화면이다. 일반 포털과 같이 다양한 정보를 제공한다. 평범해보인다.


큐로보 검색창에 박지성을 키워드로 입력해보았다. 위쪽에는 많이 검색된 키워드 리스트가 나열되어 있고 아래쪽은 박지성 관련 온톨로지 기반 검색어들이 나열되어 있었다.


다른 포털과 차이점을 찾기 위해 네이버 검색창에 박지성을 입력 해 보았다. 네이버는 많이 검색된 키워드 위주로 보여주어 온톨로지 기반의 시멘틱 검색과는 거리가 있어 보였다.


검색을 시작하니 키워드에 대한 검색 결과를 각 분야별로 나누고 통계를 내어 일목요연하게 정리한 메뉴바를 볼 수 있었다. 내가 입력한 키워드가 어떤 성향의 정보에 속해 있는지 알 수 있었다.


검색 결과화면 오른쪽에 온톨로지 결과를 세부적으로 보여주는 메뉴가 있었다. 박지성이라는 키워드와 관련된 온톨로지 기반 태그들이 분야별로 정리되어 나열되어 있었다. 거의 모든 포털에서 받았던 결과 화면에서는 볼 수 없었던 결과라서 검색 대상에 대해 새로운 정보를 발견 할 수 있었다. 마치 박지성과 관련된 정보를 많이 알고있는 스포츠 기자에게 박지성에대해 물어본 듯한 느낌이었다. 인그 만큼 키워드 위주의 정확하고 단편적인 정보만을 추출해내는 것이 아니라 사람이 생각하는 것과 흡사한 결과를 내어 놓는 방식이었다.  

UI를 강화한 비주얼 검색 서비스도 제공했다.
 

검색 결과를 플래시로 미리 보여주고 선택할 수 있게 해준 깔끔한 디자인과 마우스 조작으로 움직이는 인터패이스가 매력적이었다.
키워드를 MSP로 검색 해 보았다. MSP들이 소중히 포스팅 한 글들을 한 눈에 볼 수 있었다~^^. 비주얼 검색에서도 분야별로 나누어 검색 결과를 보여주는 메뉴가 있었다. 분야별 메뉴 순서는 가장 높은 비중을 차지하는 분야 부터 오른쪽 방향으로 정렬되어 있었다. 상황에 맞게 사용한다면 즐겁고 편리한 검색이 될 것 같다. 


세계최초 실.용.화 검색엔진 시멘틱스의 큐로보 소개 영상.

큐로보 Link : http://www.qrobo.com/


또다른 국내 시멘틱 검색 엔진으로는 아울림이 있었다.

검색 결과에 대한 브레인 스토밍 같은 인터페이스가 독특했다.


MSP를 키워드로 검색해 보았다.
검색창이 대/소문자를 구분했다. 그래서 소문자 msp로 검색하면 조금 다른 검색 결과를 보여주었다. 시각적으로 한 눈에 키워드 관련 온톨로지 가반 검색어들을 보여주었다. 가지에 달린 글자를 클릭하여 연속적으로 연관 검색을 할 수 있었다. 분야 별 메뉴 아래에 있는 컨트롤바는 시간 순서와 키워드와의 관계 범위 설정을 할 수 있게 해주어 본인이 원하는 검색 결과에 좀 더 다가갈 수 있도록 도와주고 있다. 직접 사용해 보니 실제 검색 할 때 자주 사용 할 만한 기능이었다.

아울림 Link : http://owlim.com/


해외 시멘틱 검색 엔진에는 Evri가 있었다. 현재 베타 서비스 중이다.

에브리.. 전부 찾아준다는 뜻인가? ㅎ
메인에 스로건 search less, understand more 에서도 알 수 있듯이 적은 검색으로 원하는 정보를 찾아 내겠다는 의미 일 것이다.


검색창에 키워드를 입력해 보면 그와 관련된 미리 Evri에서 수집 해 놓은 개념 리스트 들이 뜬다. 임의로 키워드를 입력 할 수 없게 해 놓았다. 입력하는 키워드와 관련 되지 않은 검색을 미리 차단함으로써 정확한 검색을 유도하는 제약사항이라고 할 수 있겠다. 가장 상단의 Microsoft를 선택 해 보았다.


여기에서도 브레인스토밍 기법으로 검색을 할 수 있는 인터페이스가 있었다. 마이크로소프트의 경쟁업체가 나열되었다 ㅎ 삼성도 보이는걸 보니 마이크로소프트와 밀접한 관계를 보인다고 할 수 있을것 같다.ㅎ


리스트 형식의 찾아가기 검색 방식의 인터페이스도 제공 되었다. 온톨로지 기반 키워드 관련 검색 결과들로 다양한 정보에 접근을 가능하게 도와주었다. 이러한 검색 접근법은 사용자의 검색 기술보다 검색엔진 자체에서 분석한 온톨로지 기반의 검색 정보들을 활용하는 것으로서 검색엔진이 광활한 인터넷 세상에서 안내 표지판 역할을 보다 효과적으로 수행 하는 방식이었다. 

Evri Link :
http://www.evri.com/


검색 기술의 방향

검색 기술에 있어서 이론적으로 가장 이상적이었던 클러스터링은 부정확한 검색결과의 분류와 수동 업데이트에 대한 부담으로 폐기되었고 현재 널리 사용되는 키워드 검색 기술은 방대한 검색 결과로 검색의도를 충분히 반영하지 못한 결과를 보여주었다. 지금 계속 기술 발전이 진행중이고 향후 미래 검색 기술의 중심이 될 시멘틱 검색 기술은 기술적 난제로 인해 상용화가 미비한 실정이다.


마무리

웹에서 벌어지는 사용자들의 수 많은 요구 사항들을 종합 분석하여 실세계에서 벌어지는 사건들과 연관지어 각 개인에 맞는 정보를 제공 하는것이 검색 기술이 추구하는 궁극적 목표라고 생각한다. 웹 2.0 시대를 거치면서 각 개인이 웹 환경에 미치는 영향이 커졌다. 그 만큼 활발해진 사용자의 움직임과 요구사항을 효과적으로 분석해내는 일이야말로 복잡한 작업이며 시멘틱 검색 기술이 풀어야 할 과제일것이다.
 

'MSP > Project P' 카테고리의 다른 글

개인화 미디어 포탈  (1) 2009.03.07
구글의 안드로이드(Android)  (3) 2009.03.07
나는 MSP 2nd 이다!  (2) 2009.02.25
클라우드 컴퓨팅(Cloud Computing)  (0) 2009.01.26
근거리 무선통신 UWB 와 Giga-Fi  (0) 2008.12.28