关注软件开发技术和管理的社区网站
判断网页蜘蛛最简单的一个办法就是设置一个时间段, 然后记录这个时间段内来自某个源的点击数, 再计算其点击频率, 如果点击频率很高, 则认为它是一个爬虫, 反之则是正常访问. 这种做法的缺陷在于:什么样的阈值才算是爬虫的标准呢?
1 总图片数最后更新于 2007/8/6
其实我是蜘蛛侠
18 总图片数最后更新于 2008/12/17