五月 2007 - 帖子
Milan! Milan! San AC Milan! 一场充满悬念的比赛, 戏剧性的进球, 差点重演的绝地反击, 到最后创造历史的的球员们, 这场比赛虽然场面上不甚好看, 但是充满了一切经典比赛需要的所有要素! 关键时刻, 还是要靠睡神, 帅哥, 还有那个能用PP进球的男人...伊包揽鸟Milan所有两个进球, 第一个是接睡神的任意球暴抽用脸蹭进去的(貌似很痛的说, 庆祝时连表情都没有...), 第二个则是过了门将雷纳打身下慢慢滚进去的...其实看那厮几次带球, 那水平真不是一般的菜啊, 基本上接到球就被定在那里了...
阅读全文
闲来无事, fix了在firefox下几处显示不正常的样式表, 顺手在首页上加了个到7月3号的count down timer, 关心老师辛苦了这么久, It's time to enjoy the victory :) 套用一下StarCraft2的广告语: "Hell, It's about time!", 希望能早日收到关心老师的签名赠书, 嘿嘿;-P "Hell, It's about time!" StarCraft2
阅读全文
阿西莫夫之后, 世界上还有时间机器吗? 请看: 1975年的杂文:请看苏修的一种新行业 今天发现, 王屋村地下超市的西瓜摊有5个, 看来今后五天内的每日水果就全素西瓜鸟~~ 嗯, 夏天到了...
阅读全文
不知道大家有没有发现一个相当奇怪的问题,很多中国的软件作者和软件团队都不愿意说自己的软件是国产软件,他们开始刻意地将自己和自己的产品隐藏起来,当他们的新产品推出时,经常以一个"外来和尚"的形式出现,Orbit Downloader,Foxit, IE7 Pro,比比皆是,比起国产软件这个名字他们更愿意让中国的用户以为他们是舶来品.并且当真相被表明后,他们也不愿意发表任何看法. 联想起到国外发展的NetAnts和第一代共享软件作者的命运,或许,我们对这种“软件海龟”的奇怪问题要思索,要检讨. 转载自:
阅读全文
判断网页蜘蛛最简单的一个办法就是设置一个时间段, 然后记录这个时间段内来自某个源的点击数, 再计算其点击频率, 如果点击频率很高, 则认为它是一个爬虫, 反之则是正常访问. 这种做法的缺陷在于:什么样的阈值才算是爬虫的标准呢? 10秒内点击12次, 还是5秒内点击6次? 而且, 对于那些一次性打开多个并发请求的爬虫类型来说(比如突然来个20并发请求的burst), 这个方法可以说是很有效, 但是对于那些周期性的请求爬虫来说(比如每隔1秒请求一个页面), 这种算法就完全失效了, 所以你网站上的信息还是在不知不觉中流失.
阅读全文
之前曾经发布过一个阻止网页爬虫的HttpModule,虽然效果很棒(yishan.cc服务器就正在用哦 :)),但HttpModule是在CLR当中处理请求的,还是会消耗部分服务器计算资源,最佳实践还是为IIS写一个ISAPI Filter,当服务器第一次接受到来自客户端的http request header时会触发一个OnPreprocHeaders事件,所以通过在ISAPI Filter中注册一个callback方法到这个事件上,我们就可以根据来自header中的ip address和user
阅读全文
今天小白了两次... 1. 尝试写一个BHO(Browser Helper Object),用来实现一旦发现网页中有sex or illegal相关内容时,就redirect到一个警示页面。因为是个com组件,所以用guidgen.exe替所有的自定义接口都分配了一个GUID,结果发现组件死活无法工作,用attach process的方式发现ie根本没有加载我写的组件。无奈上网下载多份源码读罢,才发觉自己把系统接口IObjectWithSite的GUID也替换了,直接导致QueryInterface函数无法使用...改回声明文件中的GUID,bug解决。
阅读全文