48

Google 跟同桌 Bing 说:同学,别再抄袭俺的搜索结果了嘛

2011年2月2日

好吧,尽管Google也在向Bing致敬(比如可更换搜索的背景图Google Images的搜索结果界面),但好歹不是那种赤裸裸的复制(微创新?),相当于扫了一眼答案,然后再用自己的能力从头到尾验算一遍。但是Bing直接抄袭Google同学的搜索结果就比较说不过去了,抄袭证据呢?嘿嘿,Google同学发现搜索A同时自动纠正为B的搜索结果,在Bing同学那边搜索A,出来的结果居然直接就是B。

Google一名专家Amit Singhal说:

我用自己的职业生涯致力于做出一个优秀的搜索引擎,如果竞争对手的算法比我们的好也就认了,但在我的词典里,抄袭不等于创新(在腾讯的字典里抄袭等于微创新?)。

在去年5月的时候,Google发现Bing的某些搜索结果非常棒,跟Google的搜索结果一模一样的棒,即便是你输入了一个错误的搜索关键字。比如你搜索一个错误拼写torsoraphy,Google返回结果是这样的:

Google并不会给你错误拼写单词的错误结果,而是给出正确拼写Tarsorrhaphy的搜索结果,同时在最上方告诉你我们现在给你的是正确拼写Tarsorrhaphy的结果,你也可以坚持搜索错误拼写的torsoraphy。

咱再看看Bing同学,搜索错误拼写的torsoraphy,天那它居然在第一条直接给你返回正确拼写的Tarsorrhaphy结果了(目前依然是如此),那个第一条结果的维基百科页面里压根就没有错误拼写的torsoraphy单词:

Google的团队对于错误拼写的纠正下了很大的功夫,他们甚至可以纠正那些之前从没人搜索过的单词。拼写纠正团队的工程师们一直在监视竞争对手是否也会出现非正常的搜索关键字,所以当他们看到Bing居然能在错误拼写搜索结果页面给出正确拼写搜索结果条目的时候,他们震惊了。

到了去年10月,Google团队这帮人已经被震的麻木了,在做了广泛调查后他们发现Bing显示的搜索结果与Google的重合度大大提升了,最厉害的是前10个搜索结果100%重合度的情况也大大增加了。

此时Google开始怀疑Bing同学在抄袭他们的搜索结果了,你搜索结果越来越像我可以说是自己算法提升了,但你连我错误自动纠正的结果都自动按照对的结果抄了去,这个就露馅了啊。然后Google也开始邪恶的想,是不是微软的IE浏览器在搜集用户跟Google搜索的结果呢?他们的Bing工具条也很有可能是帮凶。

请Bing君入瓮:

猜测不能当证据使,于是邪恶的Google同学干脆决定以后考试的时候故意写错几题,答案还要非常离谱,看看Bing同学说是不是也写了同样离谱的答案。于是Google首次手动更改了100个关键字的搜索结果排名(啊哈,Google终于承认自己手动改排名了,但是为了吊Bing同学上钩),把一些很糟糕的网站提到前面显示。

这个实验开始于去年12月17日,大概有20位工程师参与,他们被要求回家后使用IE浏览器,打开“推荐的网站”(Suggested Sites)功能,并安装Bing工具栏,对这些手动调节过的搜索关键字进行搜索,同时点击第一位的搜索结果。到12月31日,这些关键字里出现的那些糟糕的搜索结果已经陆续登上了Bing的搜索结果页面,啊哈,Bing就这么乖乖的上钩了。

提供当时他们测试用的mbzrxpgjys这个关键字的截图证据(Google的实验已经结束,该关键字第一位已经不再是RIM),这个无意义的关键字之所以第一位搜索结果是RIM,都是Google手动调节的结果:

然后12月31日,Bing同学已经抄袭完毕mbzrxpgjys(到目前为止,Bing依然将RIM作为这个无意义关键字的搜索结果第一位),把错误的答案交上来了:

微软利用自己的IE和Bing工具条嗅探人们在Google搜索关键字和搜索结果,然后抄袭到自己的搜索结果里:

当然如果你现在尝试搜索一些关键字的话,你会发现Bing同学的答案跟Google同学完全是不同的啊?咱们可以这么理解,对于那些热门关键字,Bing的搜索算法会起到作用实现不错的搜索结果,那么他们就用自己的算法。而对于那些生僻的关键字,或者说那些Bing知道自己搜索结果不佳的关键字,Bing就会去抄袭Google的搜索结果,以掩盖自己欠佳的搜索结果。实际上在Google测试的100个生僻关键字里,只有7-9个被Bing抄了去,Google自己也不明白这是为什么。

作弊方法:

那么IE到底有没有在搜集用户的搜索信息呢?当然是这样的,而且默认的设置就是如此,不过罪魁祸首很可能是“推荐的网站”(Suggested Sites)功能:

“推荐的网站”(Suggested Sites)功能会基于你浏览过的网站,来给你推荐出类似的网站。当这个功能打开的时候,你在地址栏里输入的网页地址会连同一些基本的电脑信息发送给微软。

另外一个罪魁祸首则是Bing工具栏,它会搜集你的系统和一些额外信息,将包括搜索关键字、你访问的网站和你如何使用软件的信息发送给微软,以提升服务水平(抄袭Google确实可以提升Bing的搜索质量,恩,微软这次没撒谎):

尽管Google的Chrome也有这个功能,但他们表示他们的做法跟微软不同。他们只会让Chrome返回用户访问的URL地址,但不会使用这些URL地址和其中包含的信息,也不会把这些信息用于Google的搜索结果页面里。

合法性:

那么Bing同学是否违法了呢?不太好说,不过起码Google并未想要发起诉讼,他们认为Bing还是有自己的算法的,只不过在某些搜索关键字上在模仿Google。

合理性:

那我可以说Bing同学的做法是合法不合理的吗?恩……也不太好说。我为什么不能复制Google的搜索结果?人人都可以这么做,Google管不到你,只不过Bing的做法有点旁门左道,或者说不是一个大公司应该做的事儿。Bing并没有偷取Google的搜索算法,而只是用最拙劣的方法复制Google前几位的搜索排名结果,就是说它只能看到Google同学的最终计算结果,而没看到Google同学的整个解题过程,如果Google同学的正确答案可以得10分的话,Bing同学只有结果没过程的答卷也许只能得2分?3分?不过也得看是哪种类型的题了,如果是判断题的话……那Bing同学还是可以拿10分。

当微软在2009年发布Bing的时候,业界都戏称这个名字的全拼写法是“Because It’s Not Google”(因为它不是Google)或者“But It’s Not Google”(但它不是Google),现在我们终于知道了正确的写法:“Bing Is Now Google”(Bing现在就是Google),嘎嘎~~

Via SEL
Pic via fotosa.ruHype Lounge and bookofodds




Related posts

coded by nessus
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 跟同桌 Bing 说:同学,别再抄袭俺的搜索结果了嘛
本文地址:http://www.guao.hk/posts/google-said-bing-is-cheating-copying-our-search-results.html
本文短网址:http://guao.cc/uC9
  1. 2012年5月8日14:47 | #1

    原来工具条这样的,难怪。

    Thumb up 0 Thumb down 0

  2. EdiTurn
    2011年8月4日16:26 | #2

    @比尔盖子:
    不是你纠结于那个“is”到底存在吗?我的意思是从搜索结果来看,那个is确切存在。

    Thumb up 0 Thumb down 0

  3. 2011年8月4日16:23 | #3

    @EdiTurn:
    有什么意义吗(我知道这个死循环啊)

    Thumb up 0 Thumb down 1

  4. EdiTurn
  5. 2011年7月16日18:07 | #5

    @EdiTurn:
    应该是GNU Not Unix,而不是GNU is not Unix

    Thumb up 0 Thumb down 0

  6. 2011年3月14日15:10 | #6

    还好没把名字都抄上啊,哈哈

    Thumb up 0 Thumb down 0

  7. 2011年2月5日23:35 | #7

    @test:
    多谢提醒,已改。。。

    Thumb up 0 Thumb down 0

  8. test
    2011年2月5日21:23 | #8

    那么IE到底有没有在搜集用户的【索索】信息呢?
    那么IE到底有没有在搜集用户的【搜索】信息呢?

    Thumb up 0 Thumb down 0

  9. roxi
    2011年2月3日12:53 | #9

    这可真是欢乐啊~~!微软这下搞大发了。

    Thumb up 0 Thumb down 0

  10. zhangsong08
    2011年2月3日10:55 | #10

    哇哇 微软搜索方面要吃官司了

    Thumb up 0 Thumb down 0

  11. 2011年2月2日20:17 | #11

    微软……只是做了他们一直以来都在做的事情,只不过很不幸的是这次对手是Google,否则换成别人恐怕会像可怜的网景公司一样死无葬身之地了。
    其实Google用不着告他们(乱花钱),只要人们不再那么信任Bing,Google就大获全胜了。毕竟人们始终没忘记微软的邪恶之处。

    Thumb up 2 Thumb down 0

  12. 2011年2月2日09:27 | #12

    百度会修改一下,哈哈~ 配图是亮点

    Thumb up 0 Thumb down 1

  13. 2011年2月2日05:01 | #13

    bing这次玩大发了。
    貌似google这次是扇了所有搜索引擎的耳光,也许这事,我们还可以调查下百毒。

    Thumb up 8 Thumb down 0

  14. lion
    2011年2月2日02:45 | #14

    大家都在采集很正常

    Thumb up 0 Thumb down 0

  15. EdiTurn
    2011年2月2日01:29 | #15

    最后那句话让我想起了“GNU is not UNIX ”

    Thumb up 2 Thumb down 0

  16. 赵贰曜
    2011年2月2日01:18 | #16

    Bing的中文搜mbzrxpgjys结果有意思。

    Thumb up 0 Thumb down 0

  17. msxcms
    2011年2月2日01:07 | #17

    大家都是采集站,只不过微软连google也采集而已

    Thumb up 9 Thumb down 0

  18. ninetales
    2011年2月2日00:45 | #18

    配图再形象没有了

    Thumb up 7 Thumb down 0

  19. 2011年2月2日00:45 | #19

    这件事很有趣!

    Thumb up 0 Thumb down 0

  20. 2011年2月2日00:32 | #20

    这个事儿很搞笑啊。微软会不会出来解释下呢?

    还是说,彪悍的人生,不需要解释?

    Thumb up 0 Thumb down 0

  21. wxtuzi
    2011年2月2日00:23 | #21

    去年google宣布退出中国,不再屏蔽搜索结果的时候,百度和搜搜全部再向google致敬。百度的很多搜索结果是盗链的google的。

    Thumb up 1 Thumb down 0

  22. iamvirus
    2011年2月2日00:23 | #22

    沙发

    Thumb up 0 Thumb down 1

  23. Joephuy
    2011年2月2日00:13 | #23

    麻花疼表示你这也算抄袭?太嫩了

    Thumb up 12 Thumb down 1

  24. xxx
    2011年2月2日00:11 | #24

    百度也来个?

    Thumb up 9 Thumb down 0

  1. 2011年2月2日00:45 | #1
  2. 2011年2月2日01:01 | #2
  3. 2011年2月2日01:53 | #3
  4. 2011年2月2日06:12 | #4
  5. 2011年2月2日06:15 | #5
  6. 2011年2月2日06:57 | #6
  7. 2011年2月2日07:12 | #7
  8. 2011年2月2日13:27 | #8
  9. 2011年2月2日16:47 | #9
  10. 2011年2月2日23:30 | #10
  11. 2011年2月3日10:19 | #11
  12. 2011年2月3日21:04 | #12
  13. 2011年2月4日02:10 | #13
  14. 2011年2月4日21:32 | #14
  15. 2011年2月4日23:48 | #15
  16. 2011年2月5日00:08 | #16
  17. 2011年2月5日02:22 | #17
  18. 2011年2月6日01:27 | #18
  19. 2011年2月9日10:09 | #19
  20. 2011年2月13日10:06 | #20
  21. 2011年2月14日01:21 | #21
  22. 2011年2月17日09:53 | #22
  23. 2011年9月11日09:31 | #23
  24. 2012年1月1日19:40 | #24
首次留言需审核,之后不会再审核。由于缓存机制您的留言可能不会立即显示出来,请稍后刷新本页面

您可以直接点击别人评论右侧的回复,这样您的回复评论将同时发到原作者信箱