지금까지 블로그 스팸 댓글의 특징들 정리

스팸 방지 플러그인을 만들면서 알게 된 것들을 정리하는 중.

  • 외국 스패머의 경우 당연히 한글이 한글자도 없다. (간혹 외국 스패머도 번역기능을 사용해 엉터리 한글을 구사하기도 하지만 희귀함)
  • 홍보를 위해 같은 URL이 반복적으로 내용에 들어간다.
  • 필터링을 방지하기 위해 글자사이에 띄어쓰기나 특수문자를 많이 끼워넣어서, 유난히 특수문자를 많이 포함하게 된다.
  • 짧은 간격으로 여러번 글 입력 쿼리가 들어온다.
  • 같은 내용의 댓글이나 트랙백이 반복해서 들어온다.
  • 홈페이지 입력란에 도메인만 입력하는 것이 아닌 .html이나 .htm으로 끝나는 파일 주소가 들어오는 경우가 있다.
  • HTML 태그를 사용하려고 입력하곤 한다.
  • 무료라든지 공짜, 대박, 뭐 그런 유혹적이거나 자극적인 단어를 많이 사용한다.

글쓴이 : Draco (https://draco.pe.kr)
크리에이티브 커먼즈 라이선스 이 글은 CCL 저작자표시 3.0에 따라 원작자를 표시할 경우 자유롭게 이용할 수 있습니다.

You may also like...

5 Responses

  1. 구차니 댓글:

    가끔 alnum() 함수를 변형해서 순수 알파벳이나
    숫자와 알파벳의 유사성을 통해서 e와 3을 쓴다거나 이런 패턴도 있지만 정형화 하기 모호하더라구요.

    • Draco 댓글:

      잔머리를 쓸려면 한도 없는게 잔머리니까요.
      그런 자잘한 특징은 무시하고 링크라던지 공통점만 골라서 99% 잡는걸 목표로 하고 있습니다 ㅎㅎ

    • Draco 댓글:

      그런데 정말이지 우리나라 분들 스팸과 외국스팸은 꽤 스타일이 달라서 재미있어요. 우리나라 분들은 수작업이 많은거 같더군요.

  2. 데굴대굴 댓글:

    추가로 짧은 시간 안에 대량의 댓글을 붙인다는거 까지요. ^^