上月底,Google正式发布了Google Docs Viewer这一查看PDF等文档的利器,但是复杂的操作让人十分头疼:如果我们要看第三方网站上的PDF的话,要先打开Docs Viewer,然后复制PDF文件地址,再粘贴到viewer中。我们之前介绍过使用书签栏的方式解决这一问题,但是其只适用于PDF文件而且要多点一下鼠标。现在我们有了更好的解决办法,使用Greasemonkey脚本。
这个脚本可以将页面上所有的PDF / PPT / TIFF文件链接直接链接到Docs Viewer,也就是说启用这个脚本后,你不用做任何操作就可以方便的预览上述文件类型了,预览后觉得满意还可以直接下载,实在是太方便了。
via googleos
如果你在Google工具栏的设置里面激活了PageRank的选项,你就可以在工具栏上看到当前访问网站页面的PageRank,这一选项默认是不打开的。
如果你选择打开的话,Google的工具栏会把当前页面的URL发送到Google的服务器,并返回此页的PageRank。也就是说,你把自己的网页浏览记录发给了Google,当然,如果你没有激活“网络历史记录”这项服务,这些记录是不会算在你的名下,不过这些数据对于Google来说还是很有价值。
Google Public Policy Blog 提到他们会把这些数据用在两个方面,一方面Google可以知道那些URL被访问得多,然后把它的恶意网址扫描软件的精力优先放在这些URL上。另外,Google也可以知道这个URL加载花了多少时间,比如浏览器访问Google Maps的时候,工具栏会启动一个计时器计算加载的时间,之后把这个时间与URL一起发回Google的服务器。

在上图中可以看到,工具栏发送了很多信息给Google的服务器,其中有一个参数叫querytime,就是用来度量加载时间的。
所以,Google不仅知道那些页面被访问最多,也能知道各种条件下页面的加载时间。
via Google Operating System
这个网站 www.mysterygoogle.com,你键入关键字,点击搜索之后,他返回在你之前来这里搜索的人所搜索的东西。因为你完全不知道你之前的人是谁,所以你得到的结果是几乎随机的,当然,你键入相同的关键字,下次返回的也是不同的结果。

我试用了下,搜索“阅兵”,返回“It's boring”的结果,你怎么知道我这样想?
换一个,搜索“谷奥”,竟然返回圣经的“Do not judge, or you too will be judged”(你们不要论断人,免得你们被论断),受教了...
玩几次,会有意想不到的结果,给自己惊喜一下吧。
via mashable
你也许没有听过Chuck Norris的大名,不过他在国外可是大名鼎鼎,此君的的眼泪能治癌,可惜的是他从来不哭,而且据说广岛从来就没被什么原子弹炸过,而是Chuck Norris跳下飞机,然后一拳轰在地上。
先看互动百科的介绍
Chuck Norris是美国的一个现象,如同许纯美是中国台湾的现象,巴士阿叔是中国香港的现象,芙蓉姐姐和145是中国大陆的现象。他是个武术家,演了一个电视连续剧,大约是《Texas Ranger》之类的名字罢,里面演一个美国式英雄。不幸的是,演的实在是太做作而失败了……
结果有个好事者在网络上写了"100 TOP facts about Chuck Norris",全面地讽刺了Chuck Norris的武术、霸气,还有性能力。这个东西在美国网络上引起了轰动效果,Chuck Norris于是出名了……
故事的高潮是某天一个脱口秀节目中,Chuck Norris自己念出了这100条里他最喜欢的10条——请注意,他半真半假地觉得人家是在捧他,笑得很开心……
是不是觉得还不够厉害呢
现在打开谷歌首页,在搜索框里输入“Google Chuck Norris”,然后点击“手气不错”,你会看到“Google won't search for Chuck Norris because it knows you don't find Chuck Norris, he finds you.”(Google 不会去搜索Chuck Norris,因为Google知道不是你找Chuck Norris,而是他找你 )

via The Christian Science Monitor
自1980年以来,新闻组真实记录web的诞生和微软的崛起以及其他众多里程碑事件。
2001年2月,Google收购了纽约的一家新闻组公司deja.com,这家公司有着1995年以来的新闻组记录,改名为Google groups,之后,Google又将这些记录跟Unix大师Marc Spencer持有的记录合并,这样google就有了35000个新闻组的7亿多文章,时间跨越20多年。 对于当时没落的新闻组,geek们都把Google当作拯救的英雄。
不过,让人失望的是,Google很快失去了兴趣,在Google的众多产品中,groups的暗淡与他的辉煌历史极不相称,这里恐怕只有那些具有怀旧情结和考古怪癖的人才会流连忘返。
Google另有新欢Google books,Google为之宁愿冒天下之大不韪,而Google groups只能在一旁默默无闻,无人搭理。在去年的这个时候,slashdot的一名用户报告一个bug,在一个特定的群组中搜索竟然没有返回任何结果,而Google不仅没有解决这个bug,甚至视而不见,不把它提上日程放到“known issues”里面,但被人询问而不得不做出答复的时候,Google的一位发言人Jason Freidenfelds只是在回复的email里淡淡的写道:我们一直在改进我们的产品。
有人说,Google groups并不能带来很好的收益,所以才会被束之高阁,这也说明Google是一家广告公司而不是现代的亚历山大图书馆。
这个情况最近渐渐开始改变,在wired的文章登出后一天,Google的groups奇迹般的好了,现在在特定的组里搜索能够返回结果,例如在alt.hypertext中搜索mosaic ,10月7号的时候返回数目是0,8号搜索却有844 条。
在这一天,Google做的还不错

via Wired
Matt Cutts 在最近的Google Webmaster视频提到,很多站长抱怨Google的搜索引擎对他们的robots.txt文件视而不见,他们不想让有些网页被Google索引到,但是他们还是发现这些网页url还是出现在了Google的搜索结果里面。
Matt说,robots.txt告诉搜索搜索引擎别抓这个页面,Google也确实遵守约定不抓这个页面,这也是你在搜索结果该链接下面看不到摘要片段的原因。
那为什么这些页面还会出现在Google的搜索结果里面呢?Matt举例子说,搜索California DMV,会指向www.dmv.ca.gov这个网站,尽管这个站点屏蔽了所有的搜索引擎,但是Google还是给出了这个站点的链接,原因在于像纽约时报,eBay之类的站点在链接到这个站的时候都会在锚点加上说明文字"California DMV",这就帮助Google不用抓取这个站点的页面也能返回到这个站的链接。
Matt 另外提到,他们还可以通过Open Directory Project(DMOZ)这样的网站得到url的信息,比如Metallica.com这个站也在robots.txt中禁止Google抓取页面,但是Google从Open Directory Project中就能获取Metallica.com的描述信息显示在搜索结果的摘要片段里面。
当这种情况发生的时候,好像是Google没有遵守robots.txt的约定,但是实际上不是的,matt说Google不会冒犯robots.txt的约定,不抓取页面也能返回对用户有帮助的信息
via matt
上个月底,Google正式发布了Docs Viewer,但是如果我们要看第三方网站上的PDF的话,先打开Docs Viewer,然后复制文件地址,再粘贴到viewer中这个过程有些麻烦。好在noscope制作了一个小脚本,可以将网站上的PDF文件链接修改为直接用Docs Viewer打开的方式,使用方法如下:
via noscope

以前在Google的搜索结果页上,PDF文件会有一个View as HTML的链接,点击可以用HTML的方式查看PDF文件。昨天Google对此进行了更新,部分PDF文件后面的链接变成了直接的View,点击这个链接将在新窗口用Google Docs/Gmail中应用的PDF查看器打开这个PDF文件,同样支持关键字高亮,文件内查找等高级功能。但是现在还不是所有的PDF都有了View链接,比如这个搜索,部分还保持着View as HTML的形式,由此猜测这个转换应该不是实时进行的。

via googleos