야후 블로그 검색의 중복글 문제

사용자 삽입 이미지
야후 블로그 검색에서 내 블로그를 검색할 경우, 모든 글에 “이 블로그 글에는 1개의 중복된 문서가 있습니다”라고 표시가 나온다.

이 문제는 텍스트큐브가 “문자” 주소와 “숫자”주소 두가지 체제를 가지고 있으며, 문자주소를 설정했을 경우에도 숫자주소가 접근이 가능하기 때문에 생기는 문제이다.

사용자 삽입 이미지
예를 들어 벼랑위의 포뇨를 감상한 글의 주소는 http://draco.pe.kr/1042 라는 주소와 http://draco.pe.kr/entry/벼랑위의-포뇨를-늦게-보고 라는 두가지 주소를 가지게 된다. 야후 검색은 같은 글의 두가지 주소를 가지고 “중복된 글”이라고 판단하고 있는 것이다.

물론 주소가 2개가 있을 경우 논리적으로 2개의 문서라고 볼수도 있는 일이다. 하지만 예전에 야후 블로거 간담회에서 들은 바로는 중복글에 대한 랭킹 감점 처리 비슷한게 있다고 들었기 때문에, 이런 문제점이 달갑게 보이지 않는다.

글쓴이 : Draco (https://draco.pe.kr)
크리에이티브 커먼즈 라이선스 이 저작물은 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스에 따라 이용할 수 있습니다.

4 Responses

  1. 지민아빠 댓글:

    제생각에 중복글에 대한 감점은 아마 중복글로 처리된 주소에 대해서 주어질테고, 원본글로 감정된 글은 아마 가산점을 받을 것 같습니다. 퍼간글=좋은글 논리죠. ^^

  2. 데굴대굴 댓글:

    야후가 사고를 친거 같습니다. 제 블로그의 랭킹이 갑자기 1000위 안쪽으로 매겨져 있습니다. 제 블로그의 정상적인 순위는 20000~25000 사이입니다. 현재 1000등 안쪽은 Draco님보다 높은 순위입니다. -_-a (말도 안되는 상황이 발생한겁니다. -_-)

    퍼간 글이 있는 경우, 원본이 게시된 블로그에 부여하는 점수보다 퍼간 글에 대한 감점이 더 크다고 예상되는군요. 제 예상이 맞다면, 중복처리의 경우(한글 URL과 숫자 URL이 동시에 있는 경우) 감점+가산점의 합이 기존의 점수보다 적을 것이며, 이에 따라 제 앞쪽에 있는 분들의 순위가 파악~ 떨어진 것으로 예상됩니다.
    이는 원본에 가산점을 주지 않고 퍼간 글에 대해서 감점을 한다고 해도 역시 전체적으로는 마이너스 점수를 얻게 니까 역시 등수가 떨어지는 결과가 나옵니다.

    야후가 새로 고쳐져야 알겠지만, 어떻게 처리할지… 고민 좀 하겠군요. ^^

    • Draco 댓글:

      저도 블로거 간담회를 할때쯤 8천등쯤 했다가 급상승했더군요. 블로거 간담회후에 야후가 알고리즘을 바꾼 모양입니다.

      뭐 데굴데굴님이야 천등안에 들어갈 자격은 있지만…’우리보다 나은 블로거가 천명밖에 안되나’라는 아쉬운 감은 있군요.