야후 블로그 검색의 중복글 문제

사용자 삽입 이미지
야후 블로그 검색에서 내 블로그를 검색할 경우, 모든 글에 “이 블로그 글에는 1개의 중복된 문서가 있습니다”라고 표시가 나온다.

이 문제는 텍스트큐브가 “문자” 주소와 “숫자”주소 두가지 체제를 가지고 있으며, 문자주소를 설정했을 경우에도 숫자주소가 접근이 가능하기 때문에 생기는 문제이다.

사용자 삽입 이미지
예를 들어 벼랑위의 포뇨를 감상한 글의 주소는 http://draco.pe.kr/1042 라는 주소와 http://draco.pe.kr/entry/벼랑위의-포뇨를-늦게-보고 라는 두가지 주소를 가지게 된다. 야후 검색은 같은 글의 두가지 주소를 가지고 “중복된 글”이라고 판단하고 있는 것이다.

물론 주소가 2개가 있을 경우 논리적으로 2개의 문서라고 볼수도 있는 일이다. 하지만 예전에 야후 블로거 간담회에서 들은 바로는 중복글에 대한 랭킹 감점 처리 비슷한게 있다고 들었기 때문에, 이런 문제점이 달갑게 보이지 않는다.