Michael VanDeMar说他发现Google的爬虫正在使用伪造的引用页,也许以此来判断某种形式的spam。Michael说Google的一些隐形爬虫会发送包含错误关键字的伪造引用页地址到爬过的网页。Bing在几年前曾经也这么玩过,不过后来他们修复了这个问题,不会再被站长捕捉到发送伪造引用页地址的Bing爬虫了。
那么Google为什么捡起了Bing玩剩下的方法了呢?可能是为了判断某种形式的spam。不过当年Bing这么干的时候,引起了很多站长的反感,这也迫使Bing不再使用这个办法。而现在Google似乎做的比较隐秘,所以站长还没发现这个问题,一旦事情暴露,站长们还是会感到很头疼。
Search Engine Land的编辑RustyBrick已经给Google发去了询问邮件,但等了24小时还没有回信儿。
Related posts
- 10个 Google 有意思的事情
- Google 说爬虫携带伪造的引用页地址其实是个 bug
- Google 承诺将加快 Google 爬虫抓 AdSense 代码的速度
- Google 爬虫们已经会执行 JavaScript 来探索更多内容了
- Google 爬虫已经开始抓取 AJAX 页面里的内容了
- Google 的搜索结果已经足够实时了
- 专门的 Googlebot-News 爬虫跟 Googlebot 合并
- 一个怪异的 bug,Google 改从中国放出搜索爬虫?
- Google 可以搜索到受保护 twitter 用户的 tweets,赖谁?<--更新,赖我
- Matt Cutts 解释啥叫针对搜索引擎的“伪装”
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 用故意伪造的引用页来判断 spam?
本文地址:http://www.guao.hk/posts/google-using-wrong-referrer-page-info-to-detect-spam.html
本文短网址:http://guao.cc/Wwl
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 用故意伪造的引用页来判断 spam?
本文地址:http://www.guao.hk/posts/google-using-wrong-referrer-page-info-to-detect-spam.html
本文短网址:http://guao.cc/Wwl






@musiXboy:
谢谢,了解了。
@multiple1902:
是
这里的spam是指类似垃圾站的网页吗?
指伪造内容的SEO页面?