
尽管我们在去年8月就知道Google要上马Caffeine网页索引系统了,但是Google官方今天才正式宣布。Caffeine系统可提供比以前多一半的新的索引结果,也就是说Google可以收集到比以前更多的信息,而且Caffeine的索引速度比以前更快,它也是Google实时搜索可以实现的重要元素。
实际上当你在Google进行搜索的时候,Google并不是在做实时搜索,而是搜索Google之前已经索引到的存放在数据库里的内容,随着网络的进化,内容极大的丰富,不仅是数量上的增加,还包括更丰富的形式,比如视频、图片、新闻、实时更新等等,而且人们对搜索引擎的期待越来越高,他们希望找到最新的最相关的信息,内容发布商则希望他们前脚发出的内容,后脚就可以在Google搜索到。
为了赶上网络的进化和人们的期望,Google祭出了Caffeine,上图显示了老式索引系统和Caffeine索引系统的区别。老系统有多个层,一些是最新的内容而其它则是较老的内容,但大多数的层需要几周才会更新一次。为了更新一个老的索引层,Google需要重新将整个网络分析一遍才可以,所以不能保证让你看到最新的内容。
而有了Caffeine,Google可以在很短的周期里就分析一遍网络,并更新索引库。而且Google可以做到只要一发现新的网页、网页里新的信息就立即将它们加入到索引库里,它们立刻就会被你搜索到。
Google还透露说,Caffeine每一秒可以并行处理成百上千个页面,如果将这些网页都打印出来,堆在一起能达到3英里厚。Caffeine每天会在单个数据库里增加将近1亿GB的新数据,你需要62万5千个最大的iPod才能存的下这些信息,如果将这些iPod连起来能排出40英里。
Via Google Blog
Related posts
- 全球唯一一个使用 Google Caffeine 的数据中心被人肉到?
- Matt Cutts 确认已经有一处数据中心启用 Caffieine 技术
- Google 新的搜索技术 Caffeine 对 SEO 的影响
- Matt Cutts 确认 Google 用新一代文件系统来跑 Caffeine 引擎
- Google 搜索产品经理 Dylan Casey 谈实时搜索
- Google 悄悄地启用 1e100.net,打枪地不要
- 来自 Matt Cutts 的咖啡因 FAQ
- 六个对比 Google Caffeine 搜索结果变化的工具
- 代号咖啡因,新版 Google 网页搜索浮出水面!
- Matt Cutts 澄清说到今年假日 Caffeine 才会大规模上线
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 官方宣布新的网页索引系统 Caffeine
本文地址:http://www.guao.hk/posts/google-unveil-caffeine-web-indexing-system.html
本文短网址:http://guao.cc/RUQ
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 官方宣布新的网页索引系统 Caffeine
本文地址:http://www.guao.hk/posts/google-unveil-caffeine-web-indexing-system.html
本文短网址:http://guao.cc/RUQ






@白菜林:
有试过用了?
很有意思,Google每天都在做着惊人的动作!
我死活找不到咖啡因的地址了,谁有么
咖啡因..呵呵,什么时候上线呢
现在可以用了?怎么用的?
太酷了!
最新的资讯,只在 Google !!!
想知道博客里又下角合作网站那里,两列的显示方式是如何实现的呢?我用Blogger,请高手帮忙,谢谢了
Caffeine这个图一看,俺就 明白了. 很强大.
@Google不爱我:
Caffeine 结果没有 cache 的...
@xslidian:
一个“s”的妙用。嘘~
GOOGLE的数据库和服务器大得、多得让人难以想象。
对偶们而言最大的缺陷就是没有网页快照...
貌似很有用的样子.