스팸 방지 플러그인을 만들면서 알게 된 것들을 정리하는 중.
- 외국 스패머의 경우 당연히 한글이 한글자도 없다. (간혹 외국 스패머도 번역기능을 사용해 엉터리 한글을 구사하기도 하지만 희귀함)
- 홍보를 위해 같은 URL이 반복적으로 내용에 들어간다.
- 필터링을 방지하기 위해 글자사이에 띄어쓰기나 특수문자를 많이 끼워넣어서, 유난히 특수문자를 많이 포함하게 된다.
- 짧은 간격으로 여러번 글 입력 쿼리가 들어온다.
- 같은 내용의 댓글이나 트랙백이 반복해서 들어온다.
- 홈페이지 입력란에 도메인만 입력하는 것이 아닌 .html이나 .htm으로 끝나는 파일 주소가 들어오는 경우가 있다.
- HTML 태그를 사용하려고 입력하곤 한다.
- 무료라든지 공짜, 대박, 뭐 그런 유혹적이거나 자극적인 단어를 많이 사용한다.
글쓴이 : Draco (https://draco.pe.kr)
이 저작물은 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스에 따라 이용할 수 있습니다.
추가로 짧은 시간 안에 대량의 댓글을 붙인다는거 까지요. ^^
네..그렇지요.
프록시 같은걸로 ip바꿔가며 대량으로 글 쓰는 놈들도 있어서 참 곤란합니다
가끔 alnum() 함수를 변형해서 순수 알파벳이나
숫자와 알파벳의 유사성을 통해서 e와 3을 쓴다거나 이런 패턴도 있지만 정형화 하기 모호하더라구요.
잔머리를 쓸려면 한도 없는게 잔머리니까요.
그런 자잘한 특징은 무시하고 링크라던지 공통점만 골라서 99% 잡는걸 목표로 하고 있습니다 ㅎㅎ
그런데 정말이지 우리나라 분들 스팸과 외국스팸은 꽤 스타일이 달라서 재미있어요. 우리나라 분들은 수작업이 많은거 같더군요.