2008年1月18日星期五

spam常用手法及anti-spam一些粗论

1. 伪装/重定向(对浏览器和spider返回不同的页面):通过以浏览器请求2次和spider请求两次,对比结果来判定是否对spider使用了重定向
2. commnet spam(在wiki的评论中发布一些链接,凭借wiki的高权来提高自己的权重) :如果大量的主机名都解析到一个ip/一个站点有大量内容差异较小的页面/一个页面的链入和链出的数量严重不匹配(基于内容);基于链接:先人工选定一个好的种子集,通过种子集再去给其他的页面赋权。没有考虑用户的访问后的反馈/只使用了好的页面的单向传播,没将好/坏页面双向传播/对种子集的选取不能是一劳永逸的。如何从有效链接分析和用户访问模式出发,研究网络页面可信度排名

--
With regards

没有评论: