14

刨根分析:Google 指责错了,Bing 同学可能还真不叫作弊

2011年2月5日

最近Google指责Bing抄袭一事炒的火热。Google先是策划好在“搜索之未来”大会前一天爆料,然后Bing第一时间回应说Google是编小说呢,然后Google官方博客向Bing开火Bing再次不承认,同时还倒打一耙说Google也抄袭我们呢,最后Matt Cutts继续拿出了更多证据甚至连讽刺电视都插一腿进来。事情已经乱套了,这事到底谁对谁错呢?SEL的主编Danny Sullivan来了个彻底的分析,他认为Google错怪Bing同学了,以下是长篇分析。

观看用户不算抄袭:

微软不承认抄袭了Google的搜索结果,他们一直都没承认这一点,因为他们没直接看Google同学的考卷,而是利用点击数据流改进搜索结果的,只不过点击数据流的来源有Google。Bing的集团VP Harry Shum也一直坚称:

我们并没有抄袭,只是观察用户。

Bing的经理Stefan Weitz也说:

“复制”这个词有独特的内涵,这么说我们是错误的。我们只是得到了点击数据流,然后进行分析,我们并不一定全用它。

点击数据流?

Google坚持微软利用了IE浏览器和Bing工具栏监视用户在Google搜索了什么,但Bing不承认他们只监视Google,他们监视的是用户在整个网络上的操作行为。Bing可以看到用户正在浏览什么,假设他们去了百度,Bing也会知道的,假设用户在百度做了搜索,Bing也会知道你搜索了什么点击了什么。其实叫点击数据流不太准确,我们暂且给它一个更准确的名字吧:冲浪数据流。

通过冲浪数据流获得搜索活动:

人们当然上Google的次数最多,只要他们搜索了什么,Bing就知道,因为只要分析一下他们进入的网页地址就成了:

当然Bing也知道用户点击了Google的哪个搜索结果──只需要记录下一个去到的那个网站的地址即可。这样做之后,Bing就知道用户针对某个搜索关键字选择了哪个最适合的搜索结果网站。

Bing确实在分析搜索引擎,但并不只针对Google:

其实前面已经说了,Bing的这种冲浪数据流的分析并不只针对Google,而是所有网站,即便是在百度搜索,可能也会被Bing所知道。等于说是全天下所有搜索引擎都在帮助Bing提升搜索质量,这是一种很聪明的做法。Bing的Shum也承认这一点:

我们会收集所有信息,全部的点击数据流会按照不同信号种类分为不同权重。头搜索(常用词搜索)权重大,长尾搜索(非常用词搜索)权重小。

1000种信号种类:

Bing号称自己有1000种信号种类,搜索只是其中的一种,而且并没有凌驾于其它信号种类之上。

即便是Google的测试也证明了搜索信号权重不高:

Bing承认对于那些怪异关键字的搜索,Bing收集到的冲浪数据流会导致其结果与Google的搜索结果相近。Google正是掌握了这个证据才坚称Bing抄袭了。但Bing不这么认为,他们觉得即便是Google的测试也证明了搜索信号权重不高,因为Google测试了100个关键字,只有大概9%导致Bing的搜索结果跟Google一样了。

9%确实是个不高的数字,Google方面在爆料的时候也说他们不清楚为什么Bing只有9%的结果上钩了。Bing称就是因为搜索信号这个种类的权重并不高,不会导致自己的搜索结果全盘与Google一样,Google的测试反到成了证明这一点的最好证据。

为啥Google发现Bing越来越像自己了?

Google的故事里还说道他们不是无缘无故钓Bing上钩的,他们之前已经发现Bing越来越像自己了,非常多的首页搜索结果跟Google一模一样。

但Bing也不承认这一点。在去年10月Bing内部使用了全新的算法和称为Aether的实验系统,来测试排名的变化。这个变化让Google感到了冲浪数据流的存在。

实际上这是另外一个Google没清楚回答的问题,Google说他们去年5月就发现Bing开始用冲浪数据流了,但为什么直到数个月之后才发现Bing的搜索像自己?Google也不知道,可能是Bing在后来提升了冲浪数据流的权重吧。

为什么说Bing没有抄袭Google?

Bing的部分搜索结果可能跟Google很像,但仅限非常少的关键字。比如咱们搜索“pontneddfechan”看看,这是南威尔士的一个小城的名字,点击可放大:

pontneddfechan绝对是个长尾的搜索关键字了吧?首先Google找到了71000个匹配结果,Bing只有9000个。然后首页10个搜索结果里,Bing只有4个跟Google重合,而仅仅有一个(雷打不动的第一位维基百科)搜索结果的排名是完全一样的。

再看看一个拼错的单词“bombilate”的搜索结果:

这是拼错的单词,Google会给出拼对的搜索结果,然后问你是不是要坚持搜索错误的拼写。而Bing呢?压根不问你,直接给出正确拼写的搜索结果,但是跟Google的结果并不一样。别忘了Google当初就是这么发现Bing在利用冲浪数据流抄袭自己的,但是在这个例子里二者的结果并不相同。

Google为啥要吵吵Bing抄袭了?

9%的上钩率,并不完全一样的长尾搜索结果,并不完全一样的错误拼写搜索结果,那么Google干嘛还要高调爆料Bing抄袭了呢?

因为Google看到了Bing改进搜索质量的方法,特别是对于不常用搜索关键字和错误拼写的搜索结果提升很明显。对Google来说,Bing全盘抄袭Google并不是最可怕的,可怕的是Bing在利用自己的办法对Google进行去粗取精的筛选。

要Bing停止从Google去粗取精的行径?

Google并未起诉Bing,而只是爆料,并要求Bing停止通过冲浪数据流分析Google搜索结果的行径。但Bing的经理Weitz也做出了回应:

我们不会停止使用搜索信号,除非它会破坏搜索相关性,没有任何理由让我们不去分析最大流量的搜索引擎。

Weitz同时也指出他不相信Google就没有使用Google Toolbar和Chrome浏览器做着同样的勾当,以改进自己的搜索质量。其实就算Google不让Bing直接从他们那里获得冲浪数据流,他们一样有办法,因为Google的搜索引擎正在驱动着很多很多的大网站,包括ISP合作商、Ask.com、大型门户网站等等,Bing大可以继续从他们那里获得数据。

Google的工具条在干着什么勾当?

Google起初的回应是说自己从未利用工具条数据来截取任何Google的搜索结果页面,是啊,他们何必要用这种绕一个大圈子的方式获得自己搜索引擎的数据呢?他们说自己的工具栏只是去测量网站速度,至于做不做其它的事情呢?这个问题自打事情爆出的第一天就抛给Google了,但至今他们仍未做出任何回复,哈?

没完没了:

这个事情还远远没有结束,或者说才刚刚开始。这不是一场由两家公司公关部门引起的争端,而是工程师在真刀真枪的进行着较量。搜索质量和搜索结果是一个搜索引擎的命根子,Google是否还在改进自己的搜索结果?Bing是不是比以前更出色了?谁又超过谁了?这才是最重要的。

Via SEL
Pic via 来福岛




Related posts

coded by nessus
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:刨根分析:Google 指责错了,Bing 同学可能还真不叫作弊
本文地址:http://www.guao.hk/posts/why-googles-wrong-in-its-accusations.html
本文短网址:http://guao.cc/WvH
  1. 2011年3月7日10:14 | #1

    用户的行为数据从来就不是用户自己的!唉

    Thumb up 0 Thumb down 0

  2. 2011年2月7日13:06 | #2

    根据这篇文章的逻辑,它想说的是:微软没有抄袭,因为他们抄袭的太多了。相信这个不觉的荒唐吗?

    Thumb up 0 Thumb down 2

  3. wang jl
    2011年2月6日00:58 | #3

    看来远离ie和chrome果然是正确的

    Thumb up 0 Thumb down 3

  4. 2011年2月5日20:19 | #4

    分析得很细致,很到位,可能会转载之。

    Thumb up 2 Thumb down 2

  5. 2011年2月5日14:35 | #5

    对于这件事我写了点东西……不过尽管如此还是觉得很惊讶我居然猜对了一部分。

    有兴趣的话可以戳我的名字阅读(梯子自备)

    欢迎留下评论

    Thumb up 0 Thumb down 0

  6. lion
    2011年2月5日13:24 | #6

    google toolbar的数据上传,各位有空看一下数量的话,会发现很大...

    Thumb up 0 Thumb down 0

  7. 匿名
    2011年2月5日11:34 | #7

    真是高明...让用户们安上抄袭软件,去抄袭别的搜索引擎的结果,然后自己再把结果优化下,这样既剽窃了竞争对手的优质成果,又挤兑了其他竞争对手的市场份额,也许这么做已经巧妙的绕过了米国法律的制裁,但总是让人感觉到十分下作。

    Thumb up 1 Thumb down 1

  8. Henry
    2011年2月5日09:07 | #8

    那就说明bing抄了所有搜索引擎,来提升自己的服务,给自己赚钱。

    Thumb up 7 Thumb down 2

  9. CloudBai
    2011年2月5日08:56 | #9

    中文搜索中,必应的搜索结果质量并没有那么好,有时候甚至让人不太满意。只要把Google和百度放到一起做个对比,三者的高下立现。同一个关键词,百度的结果除了自家的服务,就是垃圾。必应比百度好了不少,第一页的搜索结果至少有一半都还不错。Google第一页基本上都令人满意。也许百度更懂中国,而不是更懂中文吧。

    Thumb up 9 Thumb down 0

  10. 2011年2月5日08:52 | #10

    话说,这次怎么没人批bing侵犯用户隐私呢?要是在小镇,肯定早就有很多人在嚷嚷自己的隐私问题了。

    Thumb up 2 Thumb down 2

  11. Paul
    2011年2月5日07:22 | #11

    美国版的360和QQ

    Thumb up 1 Thumb down 1

  1. 2011年2月5日07:34 | #1
  2. 2011年2月5日09:43 | #2
  3. 2011年2月6日07:26 | #3
首次留言需审核,之后不会再审核。由于缓存机制您的留言可能不会立即显示出来,请稍后刷新本页面

您可以直接点击别人评论右侧的回复,这样您的回复评论将同时发到原作者信箱