Google发表了一篇新博文解释自己的搜索引擎是如何处理同义词的,他们现在可以识别超过100种语言的同义词,而且这些同义词会影响70%的搜索结果。Google会自己分析这些同义词会对搜索结果产生多大影响,目前每50次针对同义词的搜索就只会有一次会导致搜索质量下降。从今天开始,所有同义词也会像你搜索的关键字一样,加粗显示出来,以提示你。
Google不仅知道我们熟悉的同义词帮助你提升搜索质量(比如搜索关键字里有photos的话Google会匹配出pictures的结果),Google还会扩展你的词汇,但这只会在Google很肯定的情况下才会出现。比如你搜索GM,大部分人都知道它是“Genertal Motors”的缩写,但是它还有其它意义,比如“genetically modified”(转基因),如果你搜索的是“gm wheat”,那么Google就可以准确的判断出这里的GM不是汽车公司而是转基因。如果你搜索的是“gm university”,那么Google也可以准确的判断出你要找的不是GM汽车大学或者转基因大学,而是乔治梅森大学(George Mason University),Google还知道很多很多的GM缩写意义:gm screen star wars=gamemaster,gm college=Gangadhar Meher,nba gm=general manager,甚至是一般人不知道的专业词汇:navy gm=gunners mate。
当然现在的Google还做不到万事通,比如你搜索“dell system speaker driver precision 360”,结果会发现Google认为PC和precision是同义词,自作主张的在搜索结果里加入了PC的条目。这显然是一个错误的理解,但是Google不会人肉修改这个错误的同义词理解,而是要通过改进算法的方式来解决问题,大家可以关注一下这个关键字看看Google什么时候修复好了,也就意味着他们的算法又提高了。
如果你不想让Google自作主张的帮你联想同义词进行搜索,那么你可以在搜索的词前面加上“+”,或者用引号给引起来。其实你还可以在搜索词汇前面加上“~”,这样可以强迫Google按照同义词进行搜索。
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 解释自己对同义词的搜索方式
本文地址:http://www.guao.hk/posts/google-search-changes-hot-it-handles-synonyms.html
本文短网址:http://guao.cc/UTK






@wmr:
100种语言。。。。已改
这算是语义扩展么,通过检索词上下文语境,进行推理?
他们现在可以识别超过100种语音的同义词