感谢读者 sss 的提醒。

Google Sets这个Google Labs的实验室项目将在9月5日被关闭。最初发布于2002年的Google Sets是少有的几个依然在实验室里的项目,将近10年了都没有获得毕业证书,直到现在终于面临下课的待遇。
Google Sets可以根据几个示例关键字生成更多相关的关键字,比如你输入Honda和Toyota,那么Google就会告诉你更多的汽车品牌:

Google还为此在2003年申请了专利,根据专利的解释这其实不是通过什么高深的算法实现的,而是利用爬虫抓取的网页里的列表关键字(<ul>和<ol>)、利用表格列出的关键字以及利用逗号或TAB分割的关键字获得一系列相关的关键字。专利所有人是Simon Tong和 Jeff Dean,前者是一位Google排名算法的研究员,他还设计过AdSense的目标算法和Gmail的垃圾探测学习算法。后者帮助Google设计了抓取、索引和查询服务系统的BigTable 和 MapReduce。
其实Google Sets正是Google Squared的前身,可惜的是Google Squared也确定下课了。不过Google表示他们所使用的技术都会被用于改善Google搜索。
Via GOS

Google还在忍痛割爱地挑选哪个Google Labs项目可以留下,而谁会下课。今天又确定有4个实验项目下课:
Google Squared于2009年6月发布,以表格形式提供系统而规矩的搜索结果。后来其技术也直接集成进Google搜索,比如你如果问Lady Gaga的生日的话,不必看问答网站或维基百科,Google直接就告诉你了(上图)。
而这一服务将在9月5日关闭,但其技术会继续帮助Google改进搜索结果。如果你之前保存过Google Squared的搜索条目,现在可以将搜索结果导出为CSV,或直接导入进Google Spreadsheets表格里。
Google News Timeline也是在2009年发布,它可以按照时间轴来显示新闻,Google已经在上周的8月17日将其下线:

City Tours同样在2009年发布,它是一个针对游客的服务,可以为城市观光游览提供导游服务,帮助游览者提前规划游览路线和时间表:

Realtime Mytracks允许用户在环法自行车大赛的时候跟踪HTC – Columbia车队的行踪,这个项目本来就很无厘头,关闭也是必然,不过Google没有说具体的关闭时间。
Via SEL

Google宣布改进相关搜索功能,当你搜索的时候,有可能会看到一个叫做“top references”(最佳参考)的区域,这里列出了一些相关的搜索关键字。比如你搜索的是“西雅图近邻”,会看到“top references”里就是西雅图周边的地方了(上图),暗合了所谓的“知识型”Google搜索转型。
这个“top references”区域可能会出现在搜索结果第一页的任何部分,视具体情况而定。但如果你点击了其中的一个相关搜索关键字,那么这个区域就会出现在搜索结果第一位,供你进一步参考。
另外,如果你搜索一个著名的画家,那么Google还会告诉你其都有哪些代表作:

Google表示这个改进的相关搜索,是基于Google Squared技术得到的。
Via SEL
本月 Google 的搜索结果页面有了小功能更新,用户在搜索类似 when was jean-jacques rousseau born 的问题时,Google 会在搜索结果页的最上方给出直接的答案。这样显然省去了用户点开若干个结果瞪大眼睛查找答案的功夫,如果你对直接答案心存疑虑的话,可以点开 Show sources,这样你就知道 Google 是从哪里知道的这些问题的答案了。
移动搜索的这个功能也已经同步上线。
via googleblog

我们已经看过了各种各样的被称为UI Jazz的全新的Google搜索界面,之所以以Jazz为名是因为你看到的搜索结果页面会自动根据搜索关键字进行调整,在左边的搜索百宝箱里呈现出不同的搜索分类,这跟Jazz音乐的多变性是一样的。
Google宣布从今天开始,用户将逐渐看到这一变化出现在Google主页里。除了左边的搜索百宝箱出现了更都项目以外,最重要的变化就是Google的logo标志也变了,去掉了以前的阴影设计,颜色显得似乎更鲜艳明快了。
目前这个新界面已经陆续部署到全球37种语言的Google搜索上了,在美国用手机访问移动版的英文界面也会看到新的界面。

Jazz UI从去年年底(11月20日第一次曝光)就开始测试,持续了半年才顺利毕业,这也可以理解,毕竟是Google核心搜索业务的一次彻底革新。杯具的我在这半年里一次都没看到过UI Jazz……直到现在我还看不到呢。
继续观看新界面的官方宣传片:
阅读全文...
这又是一项富文本摘要 ( Rich Snippets ) 的更新。现在,当你搜索某电影名称时,Google 会显示 IMDB 对该影片的评分和摘要。

Google 一直致力于在搜索结果中显示对用户最有用的信息。在搜索结果中可见的信息越多,用户越能确定哪个链接是真正对他们有用的。
另外,你可以在 Google Square 中快速浏览众多影片的 IMDB 评分,只需要在搜索框中输入"IMDB rating"即可。

我们经常会在Google搜索里寻找问题的答案,这也是为什么百毒知道经常出现在Google搜索结果首位,因为Google知道百毒知道知道,而如果你尝试用同样的关键字在百毒你搜索,就会发现──百毒不知道百毒知道知道。扯远了……Google开始尝试改进问题搜索的结果,假设你以前搜索empire state height(帝国大厦高度),那么搜索结果第一条的维基百科是这么显示的(只是高亮了你的三个搜索关键字):

现在,你再搜索empire state height,第一条结果依然是维基百科,但是你提问答案的结果直接加粗显示了,也就是说Google不仅知道你的问题,还知道问题的答案:

这个功能称作“回答高亮”,当然这仅限于有准确答案并能够以很短的文字回答的问题,假设你搜索“为什么要保持三个先进性”,那Google可没法在搜索页面里就直接呈现给你答案。
Google之所以能这样做,是借用了Google Squared的技术来归纳总结出问题的答案。
除此之外,Google搜索结果的“富摘要”(Rich Snippets)今天又有新内容加入:活动。比如搜索irving plaza,那么它近期的演出安排就会直接显示在搜索结果页面里:

Google已经跟一些网站合作,以在搜索结果里呈现出活动名称、链接和时间,当然你也可以让自己网站里的活动事件出现在Google搜索结果页面里,请看Webmaster Central的说明。
Update:我不知道“回答高亮”功能何时可以支持中文,起码现在Google Squared还不支持中文,所以中文的“回答高亮”似乎还没影子,一旦有了中文的支持,就可以在Google问问题,在结果里高亮百毒知道的答案,而不必进百毒知道了……Google真邪恶!我不是在调侃,这个问题已经越来越明显了,Google搜索结果越智能,我们就越少进入来源网站,对来源网站来说并非好事,哪个站长也不愿意这样的。
Via Google Blog

Google Squared今天小升级了一下(不升级的话大家都快把它给忘了吧?)。首先的改进是,它默认会列出最多120个条目了,而以前只能是30个。如果你以前搜索美国总统的话,只能看到5个总统,每个总统只列出3个项目。而现在你可以一下看到20个总统,每个总统都有6个项目(如上图)。
不仅如此,搜索结果的质量也比以前高了,结果会根据相关性和可靠性得出。以前你搜索美国第一夫人的话只能看到几个结果,现在就很不错了,而且准确性颇高。
现在你还可以对搜索结果的条目进行排序了,比如:
最后,Google Squared可以将搜索结果导出到Google Spreadsheet里,或者存储为一个CSV文件,方便你做进一步的分析和研究。比如你可以先查询一下非洲的国家,然后按文明化程度和GDP排序,将结果导出到Google Spreadsheet里,再创造出最终的统计报表(如下图)。

Google表示他们还在继续改进Google Squared,我很期待,这个机器统计的“知识搜索引擎”未来到底有没有可能超越纯人肉的维基百科?不过Google当下的任务应该是把Wolfram超越了先。
Via Google Blog
Google Squared果然很不靠谱,最近有好事者在Google Squared搜索俄罗斯联邦总统,结果列出各届俄罗斯总统的资料,结果现任总统梅德韦杰夫(Dmitry Medvedev)的Died一项却显示他在今年5月20日周三逝世……Died这一项是Google Squared自己列出来的,如果咱们自己手动增加一项,比如叫做Date of death的话,结果显示 No value found,恩这就对了。看来Google对Died和Date of death的理解是不同的,是啊,它毕竟不是一个语义搜索引擎嘛。

如果你点击Dmitry Medvedev的Died那一项,会发现死亡日期后跟着红色提示“Low confidence”,说明Google对该结果正确的信心不足(4个日期来源里显示的实际该日期是Yankovsky(扬科夫斯基)的逝世日期,他是俄罗斯著名演员),但该提示必须点击才会弹出显示的,默认不显示。我想Google Squared应该在主界面就把信心不足的结果通过颜色标注出来,减少误会,实际上不显示“Low confidence”的结果大多数还都是正确的。

据小道消息透露,目前俄罗斯人民群众情绪稳定,不过已经有俄罗斯左翼粪青表示他们会写一些教科书,名字叫《俄罗斯也不高兴》或《俄罗斯也可以说不》……
结束等待!Google Squared终于上线!不过它目前还不支持中文,所以我们也只能搜索英文关键字来体验。
首先我用介绍Google Squared时用的数码相机的例子,搜索digital camara看看。默认显示出7条数据,每条数据默认有6个条目分类,分别是:
- Item Name:项目名称
- Image:图片
- Description:介绍
- Manufactuer:制造商
- Resolution:像素
- Color Support:颜色
鼠标悬停在每个项目上,可以看到该项目来自哪里的URL地址,点击可直接进入。我发现Description一项的来源并不是完全取自官方网站,还包括购物网站、评测网站,看来数据确实是智能搜集来的而非全部取自官方网站,当然Google应该有一套对比机制,防止错误的非官方信息。Resolution一项点击后可以通过Other Value链接查看其它数据,比如默认8.0 Megapoxel,链接里的其它数据则包括有8,000,000 pixels和8 Megapoxel,完全是一个意思只是写法不同,但Google似乎还没智能到知道他们是一个意思?我想Google其实可以这么做,但它们没有这么做,它们想按字符串把所有结果都列出来,而只是按照结果最多的数据列到前面,防止万一有谁写错数据,或是数据有轻微的差异。
当然结果也并非完全正确,比如Color里,7个相机出现了3个错误:

其中把颜色错写成支持的操作系统的那一项里,Other Values为空,而另外两个错写成保修年限的那一项,点击Other Values可以看到正确的颜色(黑),你可以选择为正确的项目,我想Google也会记录下你的选择来改进搜索结果的。
阅读全文...