Google数以亿计的爬虫们每天都在以光速索引着互联网上的信息,以便我们能通过Google搜索到最新的内容。最近Google的发言人告诉福布斯说他们的爬虫现在可以跟JavaScript做深入互动了,它们甚至可以理解JavaScript代码,这将使Google可以索引到更丰富的内容。
让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去,然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。
Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine系统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。
Via Mashable
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 爬虫又学了一招:理解 JavaScript 代码
本文地址:http://www.guao.hk/posts/googles-bots-understand-code.html
本文短网址:http://guao.cc/RIa
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 爬虫又学了一招:理解 JavaScript 代码
本文地址:http://www.guao.hk/posts/googles-bots-understand-code.html
本文短网址:http://guao.cc/RIa







难怪把 mediawiki 不存在的 $1 页面都给收录了
不知道bot理解JS能到什么程度,会对页面的权重产生怎样的影响
人家都能开发出V8了,理解JS有一个非常坚实的基础。以前喜欢用ajax处理网页内容,就怕搜索引擎不明白,无奈国人还在用百毒