나루의 몇 가지 의문점

나루 검색 서비스가 오픈한지 얼마 지났다. 나루는 온네트에서 개발한 블로그 전문 검색엔진으로, ‘생각’을 검색한다는 컨셉을 가지고 서비스 하고 있다. 첫페이지부터 검색창 하나가 딱 떠 있고, 나머지는 옅은 색으로 디자인해놓았다. 한국적으로 변화시킨 구글식 컨셉이랄까? 다른데서는 보지 못한 깔끔하면서 예쁜 디자인이다. 아쉽게도 나루는 아직 축적된 데이터량이 빈약하다. 아직은 구글에서 찾아지는 블로그 자료도 안나오는 경우가 많다. 하지만 시간이 지날수록 데이터가 풍부해지고 있으니 정식 분석은 나중으로 미루고 간간히 사용해 보고 있다.

그런데 한가지 궁금한 것이 생겼다. 만약 내 아이디를 검색해보면? 한번 쓸데 없는 짓 좀 해보자.

111개가 검색되었다.

그런데 특이한 점은 내 블로그나 Draco라는 단어가 들어간 본문만 검색한 것이 아니라는 점이다.

나루에 Draco로 검색된 블로그는 처음 몇개는 내 블로그지만, 나머지는 내가 내 아이디로 다른 사람 블로그에 쓴 댓글을 검색한 것이다. 즉 본문만이 아니라 댓글에 씌여진 이름이나 주소, 댓글의 내용까지 검색해버린다는 점이다.

만약 나중에 나루의 데이터가 풍부해졌을때 여러분이 다른 사람들의 블로그에 댓글을 쓰면 나루를 통해 모조리 검색될 가능성도 무시할수는 없다. 네이버에서 악플단 사람을 이름으로 검색해서 전문 악플러인것을 알아내듯이 말이다. 물론 아이디를 바꿔가며 댓글달면 검색이 안되겠지만, 나같이 고정 아이디를 쓰는 사람들이 무심코 지나가면서 쓴 댓글의 예전과 지금을 비교해서 보면 어색한 점이 많을것이다. 좀 겁나는 점이다.

나루는 블로그 전문 검색엔진이지만, 올블로그처럼 RSS기반으로 검색하지 않기 때문에 벌어지는 현상인것 같다. 댓글마저 끌어와서 검색되는 것이, 블로그를 찾는데 도움이 될지는 좀 의문이다.

오른쪽에 붙어 있는 생각부자들에 대한 결과도 다소 아리송하다. Draco로 검색되는 가장 많은 생각부자는 아이디를 한글로 “드라코”라고 쓰는 블로그를 운영하고 있는 분이다. 저 블로그의 검색된 내용에는 영문 Draco가 없다. 포스팅 숫자도 나보다 적은편이다. 대체 무엇때문에 생각부자로 1위로 뽑혔을까? Draco의 발음을 이해해서 검색한 것일까? 아니면 URL에 draco(+숫자)라는 단어가 들어가 있어서?

2위와 3위는 더 엽기다. 저 블로그는 나와 친한 녀석의 블로그인데, 관련생각은 대부분 내가 댓글을 달은 것이다. 즉, 역시 댓글이 달려 있어서 그에 관련된 생각이 많다고 검색해 버린 것이다.

5위인 의경교양일지 블로그는 내가 최근 자주 읽어보는 블로그이다. 댓글을 몇개 남겼는데, 그것이 검색되어 버렸다.

이렇게 댓글이나 쓸데 없는 부분까지 검색에 포함해버리면 집계에 오류를 일으킬 수 있다. 예를 들어 total이라는 단어로 검색해보면 생각부자에는 total commader 라는 제목의 포럼(블로그와 포럼의 구분에 대해 여러 생각이 있을수는 있지만)이 1위로 잡혀서 total이라는 단어는 들어가지도 않은 엉뚱한 본문을 보여준다. trackback이라고 검색하면 trackback 주소를 적어놓은 수많은(6만여개)의 블로그가 검색결과로 나타나게된다. 정작 트랙백에 대해 기술한 블로그 글은 찾기 힘들다.

나루의 생각 검색이란, 비슷한 단어나 동일한 단어가 페이지내에 있기만 하면 생각이라고 검색해주는 것일까? 과연 몇세대나 지난 검색엔진이 판치는 세상에서 그런정도로 ‘생각’이라는 사고와 판단과 관련된 단어를 검색해준다고 주장해도 될까?

물론 이러한 문제점은 일부 검색어의 문제이고, 나루는 아직 한창 개선작업 중이다. 하지만 지금 당장 실질적으로 사용하기엔 올블로그의 본문RSS와 태그로 인한 검색이 더 정확해보인다.