나루의 몇 가지 의문점

나루 검색 서비스가 오픈한지 얼마 지났다. 나루는 온네트에서 개발한 블로그 전문 검색엔진으로, ‘생각’을 검색한다는 컨셉을 가지고 서비스 하고 있다. 첫페이지부터 검색창 하나가 딱 떠 있고, 나머지는 옅은 색으로 디자인해놓았다. 한국적으로 변화시킨 구글식 컨셉이랄까? 다른데서는 보지 못한 깔끔하면서 예쁜 디자인이다. 아쉽게도 나루는 아직 축적된 데이터량이 빈약하다. 아직은 구글에서 찾아지는 블로그 자료도 안나오는 경우가 많다. 하지만 시간이 지날수록 데이터가 풍부해지고 있으니 정식 분석은 나중으로 미루고 간간히 사용해 보고 있다.

그런데 한가지 궁금한 것이 생겼다. 만약 내 아이디를 검색해보면? 한번 쓸데 없는 짓 좀 해보자.

111개가 검색되었다.

그런데 특이한 점은 내 블로그나 Draco라는 단어가 들어간 본문만 검색한 것이 아니라는 점이다.

나루에 Draco로 검색된 블로그는 처음 몇개는 내 블로그지만, 나머지는 내가 내 아이디로 다른 사람 블로그에 쓴 댓글을 검색한 것이다. 즉 본문만이 아니라 댓글에 씌여진 이름이나 주소, 댓글의 내용까지 검색해버린다는 점이다.

만약 나중에 나루의 데이터가 풍부해졌을때 여러분이 다른 사람들의 블로그에 댓글을 쓰면 나루를 통해 모조리 검색될 가능성도 무시할수는 없다. 네이버에서 악플단 사람을 이름으로 검색해서 전문 악플러인것을 알아내듯이 말이다. 물론 아이디를 바꿔가며 댓글달면 검색이 안되겠지만, 나같이 고정 아이디를 쓰는 사람들이 무심코 지나가면서 쓴 댓글의 예전과 지금을 비교해서 보면 어색한 점이 많을것이다. 좀 겁나는 점이다.

나루는 블로그 전문 검색엔진이지만, 올블로그처럼 RSS기반으로 검색하지 않기 때문에 벌어지는 현상인것 같다. 댓글마저 끌어와서 검색되는 것이, 블로그를 찾는데 도움이 될지는 좀 의문이다.

오른쪽에 붙어 있는 생각부자들에 대한 결과도 다소 아리송하다. Draco로 검색되는 가장 많은 생각부자는 아이디를 한글로 “드라코”라고 쓰는 블로그를 운영하고 있는 분이다. 저 블로그의 검색된 내용에는 영문 Draco가 없다. 포스팅 숫자도 나보다 적은편이다. 대체 무엇때문에 생각부자로 1위로 뽑혔을까? Draco의 발음을 이해해서 검색한 것일까? 아니면 URL에 draco(+숫자)라는 단어가 들어가 있어서?

2위와 3위는 더 엽기다. 저 블로그는 나와 친한 녀석의 블로그인데, 관련생각은 대부분 내가 댓글을 달은 것이다. 즉, 역시 댓글이 달려 있어서 그에 관련된 생각이 많다고 검색해 버린 것이다.

5위인 의경교양일지 블로그는 내가 최근 자주 읽어보는 블로그이다. 댓글을 몇개 남겼는데, 그것이 검색되어 버렸다.

이렇게 댓글이나 쓸데 없는 부분까지 검색에 포함해버리면 집계에 오류를 일으킬 수 있다. 예를 들어 total이라는 단어로 검색해보면 생각부자에는 total commader 라는 제목의 포럼(블로그와 포럼의 구분에 대해 여러 생각이 있을수는 있지만)이 1위로 잡혀서 total이라는 단어는 들어가지도 않은 엉뚱한 본문을 보여준다. trackback이라고 검색하면 trackback 주소를 적어놓은 수많은(6만여개)의 블로그가 검색결과로 나타나게된다. 정작 트랙백에 대해 기술한 블로그 글은 찾기 힘들다.

나루의 생각 검색이란, 비슷한 단어나 동일한 단어가 페이지내에 있기만 하면 생각이라고 검색해주는 것일까? 과연 몇세대나 지난 검색엔진이 판치는 세상에서 그런정도로 ‘생각’이라는 사고와 판단과 관련된 단어를 검색해준다고 주장해도 될까?

물론 이러한 문제점은 일부 검색어의 문제이고, 나루는 아직 한창 개선작업 중이다. 하지만 지금 당장 실질적으로 사용하기엔 올블로그의 본문RSS와 태그로 인한 검색이 더 정확해보인다.

글쓴이 : Draco (https://draco.pe.kr)
크리에이티브 커먼즈 라이선스 이 글은 CCL 저작자표시 3.0에 따라 원작자를 표시할 경우 자유롭게 이용할 수 있습니다.

You may also like...

5 Responses

  1. 석스 댓글:

    블로그 전문 검색이라.. 앞으로 지켜봐야겠군요^^
    지금은 저도 제 닉네임으로 검색을 해봤더니 제가 달았던 덧글만 몇개 검색되네요;;
    제 블로그는 나오지도 않고요 ㅠ.ㅠ 제꺼 안나오니 그래서 일단 패쓰~ㅎㅎ;

    • Draco 댓글:

      아직 모든 블로그를 포함하기엔 데이터가 좀 부족한거 같습니다. 점차 나아지겠죠. 온네트가 좀 서둘러서 공개한거 같더라구요.

  2. 제다이기사 댓글:

    나루를 서비스 책임자 입니다.
    지적하신 문제점을 비롯하여 몇가지 내부 엔진에 오류가 있습니다. 오픈 이후 저희도 알게된 사실이라 메우 당황스럽게 생각 하고 수정중이 잇습니다. 이런 모습을 보여 죄송스럽구요.. 당연히 댓글은 검색의 대상이 아니구요. 독립 블로거의 경우 데이타 수집에서 발생하는 에러입니다. 생각부자에 오류는 저희도 지금 심각하게 살피고 있습니다.

    조금만 이해를 해주시고 기다려 주시면 정상화를 넘어 좋은 서비스 보여드리겟습니다.

  1. 2007년 6월 1일 금요일

    어제 애드센스를 서로 클릭해주는 클럽을 만들면 어떨까라는 포스팅을 했었는데여 많은 분들이 100프로 걸린다에 의견을 모아주셨습니다, 그래서 구글 애드센스 측에 메일을 보냈었는데여 구글측으로 부터 답변이 왔습니다. 그런데 질문내용에 대한 자세한 답변보다는 그냥 모두가 알고있는선에서의 답변이네여. 질문자체에 대한 구체적인 답변을 듣고 싶었는데. 제가 나름해석해 보면 “부정클릭을 어떻게 잡아내는지 노하우를 절대 알려줄수 없다. 설명하면 당신이 아냐, 우리..