参与过三次搜索引擎发展转折的百度,为什么要回归“简单搜索”

相信在搜索引擎技术产品化的二十余年间,我们早已经习惯了搜索引擎的商业化。不过在最近的数博会上,李彦宏却展示了一款名为“简单搜索”的语音交互搜索App,并且声明简单搜索永无广告。

相信很多人也曾想象过这样一款产品——通过语音发问,得出最简单的答案。不过可能大多数人没有想到,推出这款产品的是百度。很长一段时间内,百度的搜索引擎商业化一直为人诟病。但这次百度率先推出永无广告的语音交互搜索,无疑是在搜索引擎的技术和产品形式上都进行了重要创新。

当我们在质疑大企业的创新能力时常常会忽视一点,在技术和产品的进化历程中大企业们往往会出现在每一个关键节点。百度之于搜索引擎也不例外。

历史转折中的搜索引擎:超链分析和本土化为百度带来了什么?

目前来看,搜索引擎的发展已经经历了两次重大转折,而每一次转折百度都参与其中。

第一个转折是超链分析技术。

在一开始,搜索引擎只是简单的根据文本模型做出倒序相关性匹配。但单纯的匹配没法解决内容的质量问题,假如很多人都会搜索“蛋炒饭”,或许大家是想知道蛋炒饭的做法,可在简单的文本模型相关性之下,我只要在网页中不断重复“蛋炒饭蛋炒饭蛋炒饭”就可以把网页推到大众眼前。

超链分析技术则是把学术中的论文引用模式加入到了搜索引擎技术逻辑之中,某一网页链接被引用的越多,就被判定为越有价值。这样一来既解决了高密度排列关键词这样简单粗暴的SEO作弊模式,也极大的促进了搜索引擎的内容价值。

而这一技术就是李彦宏在早期搜索引擎Infoseek就职时期提出,并且在1997年向美国商标局申请了相关专利。在隔年的第七届万维网大会上,李彦宏就这一技术做出了相关演讲,有一种流传颇广的说法是,当年谷歌的两位创始人就坐在台下,受启发推出了谷歌的排序技术PageRank。

不过可以确定的是,PageRank的确和超链分析技术有不少相似之处,并且在2001年才通过了专利申请。

搜索引擎技术的第二个转折是本土化。

当搜索引擎开始进入越来越多的国家和地区时,我们开始意识到不同地方的人们有着不同的文化背景、不同的语言习惯,单纯的利用超链和文本模型分析已经无法满足用户的需求。

这时候搜索引擎开始引入了知识图谱、分词等等针对语言和知识的细致分析。在同一时间,2005年,百度提出了“更懂中文的搜索引擎”的概念。开始专注于中文分词技术和中文知识图谱打造。

其实百度在提出“更懂中文”的概念时,一定程度上放弃了对海外市场的追求。实际在当时,掌握着搜索引擎核心技术的百度是完全有能力去大力拓展全球市场的。相信那时候李彦宏就已经意识到搜索引擎的重点是对语义的细致分析,因此将更多的经历应用在了本土语言研究之上。而谷歌和Yandex也做出了同样的选择,使得他们在各自的市场中获得了后来者难以逾越的优势。

用AI洗牌搜索引擎:简单搜索背后的价值观

近年来,产业界都在讨论搜索引擎的下一次转折——智能化。人工智能带来的对文字、语音和图片的细致理解,以及全新的人机交互方式。都意味着搜索引擎可能会以更新颖的形式出现在人们面前。

而简单搜索,或许就是这一次转折的开始。

从简单搜索非常简洁的交互界面可以看到,百度展示出了一副未来搜索的蓝图:搜索的首选方式是语音,信息展示不再有关广告,也不仅仅依赖于超链模式。而是通过对关键词的语义理解提供相关信息。例如搜索人名,会展示出人物关系、背景故事等等。同时鼓励用户登录搜索,也有利于搜索引擎对于个人用户的信息获取习惯进行理解,从而为用户提供更加个性化的搜索结果。

在简单的产品形式背后,简单搜索依赖的是大量AI技术。像是利用NLP技术和图像识别实现极简交互方式,利用知识图谱技术组建搜索结果,利用机器学习理解个人用户习惯等等。

李彦宏在提到百度的技术和产品时,曾经表示过技术和产品应当是有价值观的——不仅追求DAU和用户时长,也要追求给用户提供价值,要教人学习,教人成长。

简单搜索恰好也是李彦宏价值观的体现,形式极简、商业公平、提供尽可能多的价值。

“简单”的搜索引擎就是回归本质的搜索引擎,相信每个人第一次在互联网上搜索什么东西时,都是想单纯的获取新知、自我增长。只是随着商业的发展,搜索这件事变得复杂起来——开始搜索之前可能就会看到很多无关的信息,搜索结果的排序关乎着金钱。

而AI或许可以重新洗牌,让一切回归本质模样——简单的搜索、公平的信息展示、有价值的知识获取。

累积财产或是挖掘潜能:那些只有创始人能做出的决策

如果纵观百度身处的这三次搜索引擎发展转折点,会发现一个很有趣的事实:在李彦宏的带领之下,百度在转折点所作出的决策,不一定是当下利益最大化的选择。

在百度决定专注中文搜索时,恰逢百度刚刚登陆纳斯达克。彼时的中国市场还不像移动互联网时代那样有着如此巨大的规模,对于上市企业来说,讲出一个“WorldWide”的故事对于资本市场显然更有吸引力。但李彦宏却决定专注于中文搜索。

在今天,每个人都认为百度不可能舍弃搜索引擎广告收入时,李彦宏却决定在下一款可能改变搜索引擎市场格局的产品中永远不加入广告。

能否做出这种决策,可能就是创始人与员工、与职业经理人之间的区别。

赫尔南多在《资本的秘密》中曾经提出过这样一个概念:资产不是累积下来的财产,而是蕴藏在财产中的一种潜能。

但大多数的情况是,员工和职业经理人无法以企业整体资产传统意义上的所有者做出决策,所以他们大多数时候是在累积财产,而非挖掘财产中的潜能。这其中的原因与当代的股权结构、所有制度等等都没有关系,而是一种从历史延伸至今的商业习俗。

创始人见证了企业的每一步成长,才有底气做出那些可以挖掘潜能的决策。可员工和职业经理人在某种角度上讲,始终是被雇佣者,于情于理都要做出能在当下累积财产的决策。职业经理人决定企业是否富有,创始人决定企业是否伟大。在每一行业中都大抵如此。

百度搜索引擎的发展上也暗合了这一规律,李彦宏做出的种种决策很多时候看起来过于“情怀”和“理想化”,是典型的“创始人情结”。可也无一例外的押中了搜索引擎从技术到产品的生长脉络。

李彦宏曾经表示过自己对于技术的寄托:简单、平等,让人们的生活更美好。或许再经过几轮未来技术进化与企业资产增长之后,这样的期许将会成为现实。

原文地址:http://blog.51cto.com/naojiti/2121288

时间: 2024-11-05 17:29:22

参与过三次搜索引擎发展转折的百度,为什么要回归“简单搜索”的相关文章

这就是搜索引擎(三)——搜索引擎优化

这个系列的文章是一只试图通过产品角度出发去理解复杂庞大搜索引擎的汪写出来的,不足之处很多,欢迎广大技术.非技术同学阅读后指正错误,我们一起探讨共同进步 本章主要讲的是搜索引擎的优化,包括提高搜索效率(云存储.缓存机制).提高搜索质量(网页去重.用户搜索意图识别.网页反作弊)及搜索的发展方向.这三个方面是在网页抓取&搜索排序的基础上发展起来的. 一.提高搜索效率 1.1云存储 为什么要用云存储?引擎处理数据量巨大且为无结构或半结构的数据,云存储和云计算为解决存储和管理海量数据而生的. 这里只介绍一

[PHP] 网盘搜索引擎-采集爬取百度网盘分享文件实现网盘搜索(二)

前情提要:最近使用PHP实现了简单的网盘搜索程序,并且关联了微信公众平台,名字是网盘小说.用户可以通过公众号输入关键字,公众号会返回相应的网盘下载地址.就是这么一个简单的功能,类似很多的网盘搜索类网站,我这个采集和搜索程序都是PHP实现的,全文和分词搜索部分使用到了开源软件xunsearch. 上一篇([PHP] 网盘搜索引擎-采集爬取百度网盘分享文件实现网盘搜索)中我重点介绍了怎样去获取一大批的百度网盘用户,这一篇介绍怎样获得指定网盘用户的分享列表.同样的原理,也是找到百度获取分享列表的接口,

oracle__删除重复记录__三种方法及总结(转载百度文库)

http://wenku.baidu.com/link?url=RIENeGUK4sjxe21_RBYLYHR9tbUUCmOZQRR0mIjldXLYwRAt4khDtLQD9dFyd3rz3s_HWLvG2oErTw8sJUb1R2QLQqSZaBO3xLA8tu2qd9q --方法1:rowid --显示重复的行 select * from persons p1 where rowid<> (select max(rowid) from persons p2 where p1.pid=p

【图像编辑】三款图像编辑软件Photoshop、AffinityPhoto、Gimp非专业简单横向对比

人的感知分为:视觉.听觉.嗅觉.味觉.触觉.视觉即是对光的强弱.颜色.鲜艳程度的感知.视觉在纸质上通过图像来表达,在计算机数字领域则通过图像(位图)和图形(矢量图)来表达,本文提及的三款软件均为图像(位图)编辑软件. 1.Photoshop(2020_21.0.1.47) 官网:https://www.adobe.com/cn/products/photoshop.html 官方直链:(需用官方下载器登录Adobe账户在线安装) *鉴于官方没有提供独立安装包,所有网上流传的安装包均由第三方提取的

Spring cloud实战 从零开始一个简单搜索网站(三)

上文已经完成了一个简单的   浏览器 到 Client 到CSDN端的通路 我们的架构是每个博客网址为一个单独的组件, 这里为了方便直接先用CSDN 那个组件复制下 我这里改成 SDN 修改下 application.properties   端口记得改 eureka.client.serviceUrl.defaultZone=http://localhost:8761/eureka/spring.application.name=sdnserver.port=8983 下面是TOMCAT   

运营商劫持

catalogue 1. 引言 2. DNS劫持 3. HTTP 劫持 4. 路由软件中植入劫持代码.用户PC本地木马 5. 劫持弹广告检测.防御手段 6. 检测方案 1. 引言 0x1: 原始的 DNS 投毒(DNS劫持) DNS 作为互联网的基础设施之一,起到把域名转换成 IP 地址的作用,比如 www.baidu.com --> 115.239.211.112 .各大运营商通常会以省为单位建设 2-4 台递归(或缓存)DNS 给用户使用,在 PPPoE 拨号时自动配置. 假若用户输错了域名

每周一书《用户故事地图》分享!设计、产品、开发必读!

内容简介用户故事地图作为一种有效的需求工具,越来越广泛地应用于开发实践中.本书以用户故事地图为主题,强调以合作沟通的方式来全面理解用户需求,涉及的主题包括怎么以故事地图的方式来讲用户需求,如何分解和优化需求,如果通过团队协同工作的方式来积极吸取经验教训,从中洞察用户的需求,开发真正有价值的.小而美的产品和服务.本书适合产品经理.用户体验设计师.产品负责人.业务分析师.IT项目经理.敏捷教练和精益教练阅读和参考,也更适合用作企业培训手册,打造高效能的团队协作能力. 作者介绍Jeff Patton在

1.搜索引擎的历史,搜索引擎起步,发展,繁荣,搜索引擎的原理,搜索技术用途,信息检索过程,倒排索引,什么是Lucene,Lucene快速入门

 一: 1  搜索引擎的历史 萌芽:Archie.Gopher Archie:搜索FTP服务器上的文件 Gopher:索引网页 2  起步:Robot(网络机器人)的出现与spider(网络爬虫) Robot基于网络的,可以执行特定任务的程序 Spider:特殊的机器人,网络爬虫,爬取互联网上的信息(可以是文件,网络)----网络自动下载程序 3   发展阶段:excite,galaxy,yahoo这些公司做搜索 4   繁荣:infoseek,AltaVista,Google和百度 5  

搜索引擎的商业价值

搜索引擎的价值是寻找,挖掘 搜索引擎给出我们的价值是寻找,挖掘. 因为在茫茫的互联网中存在着很多的网页,当然这些网页关于什么的都有,我们总要有方法来找到它们,所以搜索引擎就诞生了. 搜索引擎不断的抓取网页,进行分析,存储,当我们在搜索引擎输入框中输入某个关键词时,它就立即给出了我们排名的网页. 地图.百科.知道是搜索引擎根据收集的用户搜索数据进行定位的产品,当然,地图也许不是,当然本文只是根据个人认识来进行判断. 看看百度产品吧. 百度新闻,立足于百度新闻源,当然百度新闻的可读性并不强,因为你可