是不是谷歌的简体中文搜索结果质量被百度赶上了?

搜索的质量评估通常是看几个指标:

  1. 相关度 -- 请受过训练的人来评估每个引擎的前几个结果是否相关,评估时不参考结果的来源、引擎的品牌等。
  2. 索引规模 -- 每个引擎知道自己的规模,也就是有多少网页(除去重复的),但是不知道对方的规模,可是可以根据两方搜索结果的爬取,得知有多少网页是我有他无,或他有我无,从此得知大约两个引擎的索引规模。比较有挑战的一点是如果索引规模大了可能导致相关度下降(因为有些长尾结果会排序太靠前)。
  3. 速度 -- 就是输入搜索词,得到结果的时间。很多测试告诉我们0.2秒的速度会导致用户满意度的落差,和未来使用的频率。
  4. 新鲜度 -- 就是能爬到多新的内容,而且要有一定规模(只有新闻内容不算够新)。

在2005-2006年我刚加入谷歌时,谷歌和百度的比较:

  1. 相关度领先百度2个点(大约是今天的英语谷歌和微软的差距,就是说不大),但是我的理解是当时百度自认这方面领先谷歌。这是有可能的,因为每个公司内部评估不同,就像今天微软内部自认为英语相关度已经超过谷歌一样。
  2. 谷歌规模较大,但是很多重要的内容都没有(例如论坛)。(这里比较的是中文索引,但是其实谷歌的索引是全球所有语言都储存的,因此任何搜索可能搜出任何语言和国家的结果)
  3. 速度远远慢于百度。
  4. 新鲜度落后百度。

经过两年的努力,在2008年,谷歌和百度的比较:

  1. 相关度远远领先7个点(大约是谷歌英语刚出来时和雅虎的差距)。
  2. 索引规模是百度的10倍左右(当然,对绝大部分常见搜索词是感觉不出差别的),并且弥补了有些爬取的错误和落差。
  3. 速度大约和百度一样,虽然许多服务器不在国内。
  4. 新鲜度达到6分钟之内,也就是说一个网页上线6分钟后就可以被搜到(如果是PR值够高的话)。

发现谷歌的进步后,百度也开始更多的花功夫提升搜索质量,在相关度和索引规模都有进步。当然,谷歌也推出Google Instant、real-time search、universal search。今天,我相信谷歌还是领先的,只是过去一年中国团队不再做中文搜索,差距应该缩小了,领先程度肯定没有2008年多。

最后,除了上面的科学评估,还要考虑一些别的因素:

    1. 以上评估是请有经验和有高教育水平的人。教育水平越高越喜欢谷歌。在博士群体,谷歌远远高于百度,但是随着教育水平下降,分辨能力也下降,在高中水平的人中,就分不出差别(这里没有品牌因素,是无品牌评估),而高教育水平的是占较少比例的。
    2. 如果加上品牌,用户就会认为百度的精确度是超过超过谷歌的,就算是在2008年搜索质量差别最大的时候。也就是说,看不到品牌时,用户70%投谷歌较精确的话,加上品牌,就可能只有45%投谷歌了。
    3. 上述评估没有考虑到贴吧、知道、MP3等的影响。这些功能参杂在搜索结果里,会让百度更被认可,因而提升它的perceived 质量。
    4. 谷歌今天有不少结果出不来,这对一个搜索引擎是致命的,因为大部分用户会把这个现象怪罪到谷歌身上,因而影响谷歌在用户心中的“质量”。
时间: 2024-10-07 06:08:45

是不是谷歌的简体中文搜索结果质量被百度赶上了?的相关文章

一种让谷歌搜索引擎拒绝搜索的字符串

下面只是三行字符串而已,不是多行; 贴到google里面,搜索引擎拒绝搜索. ?????????????????????????????????????????????????????o????????????????????????????????????????????????????????????????????????????????????? ? ?????????????????????????????????????????????????????o???????????????

如何在Ubuntu Scope中利用Filter来更加精准地提高搜索的质量

在Ubuntu的Scope,目前正在研发一个新的Filter的功能.我们可以在我们的开发者网站找到有关filter的更多的信息.在那里你可以看到一些关于filter的介绍,但是真正地入手去利用它还是有一定的难度的.今天在我们的例程中,我们来具体展示如何利用filter实现更好的搜索.在实际的应用中,比如我们可以通过filter来实现如下的ctrip的Scope:     在上面的中间的图中,我们可以看到"重庆"被选中了,在第二个列中,我们可以使用我们的department来进行从一个城

谷歌发布神经机器翻译翻译质量接近笔译人员

众MM齐齐掠至,而魔法阵也终于在祭坛上绽放出冲天光芒,下一刻,一声怒吼之中,二层的BOSS出现了,赫然是一个满是针刺的满意,犹如刺猬滚成一团一般! 一路上畅行无阻,有流光剑开路,甚至我出手的机会都缩小了很多,普通的怪物,根本就挡不住流光剑的两次攻击,而凌雪若是使用横扫千军的话,则可以直接秒杀怪物,那原本凶悍的青狼守卫就如同豆腐一般的被切得痛苦不堪. 后方,风雪之中无数傲世的玩家跟了上来,最前方的赫然是其中的骑马战士系玩家,傲世狂剑骑乘着一匹血红色的战马追击了上来,挥剑喝道"给我追,今天绝不能放过

通过百度地图API实现搜索地址--第三方开源--百度地图(三)

搜索地址功能是建立在能够通过百度地图API获取位置的基础上 通过百度地图定位获取位置详情:http://www.cnblogs.com/zzw1994/p/5008134.html 1 package com.zzw.baidumappoint; 2 3 import com.baidu.location.BDLocation; 4 import com.baidu.location.BDLocationListener; 5 import com.baidu.location.Location

js搜索框 js仿百度搜索 js下拉框 jQuery.Autocomplete使用

做了一个网站,需要根据文本框的输入模糊搜索数据库内容给出提示供用户选择,就找到了jQuery.Autocomplete 效果如下图: 该插件托管在github上,具体地址:https://github.com/agarzola/jQueryAutocompletePlugin 官方的英文文档:http://api.jqueryui.com/autocomplete/ 在使用过程中遇到大坑跟大家说一下. 第一个是插件的数据源问题! 如果要使用服务器的数据源需要在调用autocomplete的时候传

看透关键词搜索意图才能做好百度推广

http://t.qq.com/pizhouxiao5294 http://t.qq.com/p/t/448359031273818 http://t.qq.com/tongshanxi5699 http://t.qq.com/p/t/460118043035845 http://t.qq.com/xinyixiaoj6847 http://t.qq.com/p/t/463452117929907 http://t.qq.com/changzhoux1361 http://t.qq.com/p/

BugPhobia启程篇章:需求分析与功能定位

0x01 :引言 If you weeped for the missing sunset, you would miss all the shining stars 我看着大巴缓缓的驶过街角,我躲在那些树后,内心安静的做着告别 相遇在一场雨里 告别在另一场雨里 多好 0x02 :项目的基本定位概述 There are no trails of the wings in the sky, while the birds has flied away.   网站基本定位 面向CS/EE领域的垂直搜

转:谷歌搜索悄然转型争移动主导权

长期以来,谷歌的旗舰产品已经成为我们生活中习以为常的部分.但是谷歌没有懈怠,其搜索服务正悄然转型.谷歌搜索17年来一直都在变 “天空为什么是蓝的?”孩子们经常问会这个问题,但是很少有父母能够立刻给出答案.以前,人们可能在百科全书或去图书馆寻找答案.近年来,父母则可以冲向电脑,在谷歌搜索中输入这个问题,然后打开各种链接,阅读各种解释,最终给孩子答案. 但是到2015年,即使看似很迅速的电脑查询也很少有人去做了.因为与移动设备相比,在电脑上输入搜索问题答案更为复杂.你不仅要在众多链接中选择最相关的链

谷歌搜索参数url参数详解

谷歌搜索表单参数url参数详解 q(Query):查询的关键词,搜索查询q是必需的URL参数之一,其他都是可选的. 当q的值包含多个单词时,用加号分隔每个单词.(text) hl(Interface Language):Google搜索的界面语言hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数.hl=zh-TW繁体中文语言界面,港台地区常使用hl=en-英文语言界面 lr(Language Restrict):搜索内容的语言限定限定只搜索某种语言的网页.如果lr参数为空,则