李飞飞、王海峰……悉数那些人工智能领域的传火者

12月14日的谷歌开发者大会上,身着红衣的李飞飞不仅激荡起了台下的掌声,还成为了各路媒体报道中讨论的焦点。这不得不让人感叹,我们又回到了崇拜科学家的时代。

或许是因为人工智能本身就是一个学术话语权极强的领域,现在的AI企业不管体量大小,往往都有教授、专家坐镇,发布论文的数量和学术竞赛排名,似乎也成了考量企业技术含金量的标准。

可问题的关键是,我们不仅优秀的科研成果,更需要能把技术从论文中带到我们身边的传火者。今天就来谈谈,怎样才能称得上人工智能领域的传火者。

论文产品化:象牙塔内外的海水与火焰

很多人的概念里都存有一个误区,论文发的多、专利申请的多、竞赛排名足够高就意味着技术有着更高的实用性和商业前景。学术上的持续探索当然是人工智能能不断进步的基础,但从论文到产品、再到优秀的产品,这期间的里程往往比我们想象中要遥远得多。

不管是论文还是赛事,往往都会给出一个理想的恒定实验环境来追求某一项技术的极致可能。比如给出统一的硬件标准或数据库,而得出的结果也是在某一标准下的最佳结果。

这就导致一种尴尬的结果:有时论文会走向一种非常刁钻的方向,很难实际应用在生活中。像是耗费大量计算资源去追求极小的模型压缩,或是牺牲计算速度去在极小范围内提升模型准确率。但这些研究成果往往只能在仿真环境中起作用,要想应用到现实中来,往往会遇到这样那样的问题。

现在很多技术模型都是开源共享的,将公开的模型进行参数调试,从一个领域移植到另一领域并不难,可想要实现产品化,就要为模型寻找到合适场景,嵌入到适用的软件或硬件中。在这一过程中,如何面对技术开源,难以建立壁垒的问题就是一个难点。

即使把技术成功产品化,也要考量产品的实际应用性。人工智能技术的加入是不是真的能提升用户体验,体验的提升和所耗费的成本之间是否又能找到平衡点……很多时候,人工智能产品还未经市场检验,就已经折戟在论文产品化的过程中了。

论文和排名仅仅是人工智能产业的一部分,我们不能否认它的价值,但也要保持清醒的头脑。有些企业靠这些可以拿到大笔融资,但这绝不是企业成功的标志。过往,论文和会议竞赛中的技术存在于科研环境中,代表的是人工智能无限的可能性。幸好,如今科学家们纷纷走出了象牙塔,把技术从仿真世界带到物理世界,向我们展示人工智能的应用性。

把目光投向物理世界,

学术力量落足在哪?

在今天的人工智能热潮中,既然有人靠水论文拿融资,自然也会有人可以成为技术的传火者,把学术能力化为产品能力甚至商业能力,成为人工智能时代的“传火者”。

(帮谷歌AI连接中国的李飞飞)

抛开谷歌的光环,从加州理工毕业的李飞飞自身也有着极高的学术起点,在斯坦福实验室中的身体力行培养出了不少牛人,也凭着TED上强大的演讲能力吸引了不少人关注计算机视觉领域。

李飞飞对人工智能领域最大的贡献无疑是创立了世界上最大的图片识别数据库ImageNet。此前机器学习一直饱受过拟合和泛化的困扰,学界一直试图在模型上寻找解决方式,直到李飞飞开始主导ImageNet的研究,从数据集入手试图改变游戏规则。

ImageNet的影响力越来越大,甚至从中诞生了卷积神经网络这样实用性极高的技术,计算机视觉和深度学习也越来越多的应用在物理世界中:社交网络的图像标注、自动驾驶的物体监测……包括李飞飞自己在谷歌街景上添加的种种功能,如通过分析汽车分析街区政治倾向等,在CV和产业结合中缔造了更多想象空间。

大量的落地应用也再不断的向CV技术提供反馈,物理世界的技术应用也催化了仿真世界中技术的发展。

(为百度布局AI的王海峰)

NLP和CV两个领域,都聚集了大量华人科学家。在学界和产业界都有布局的,王海峰算是其中一个典型。

王海峰在学界的成就很高,是迄今为止国际计算语言学会(The Association for Computational Linguistics)唯一出任过主席的华人,也是首位来自大陆的会士。还曾获国家科技进步奖及创新争先奖等等。

2010年王海峰入职百度,百度也给了他很大的发挥空间。他先后为百度开拓并发展了自然语言处理、知识图谱、深度学习、语音技术、图像技术等多个技术方向,并在2013年上半年作为执行负责人协助创建了百度深度学习研究院(IDL),这些开拓性工作奠定了百度人工智能的基础。在担任百度搜索业务群组任副总经理期间,王海峰总负责百度搜索引擎、信息流、手机百度等百度最核心的业务,并打造了小度机器人、度秘等新的明星产品。从这些动作就能看出,王海峰不仅科研能力突出,还很善于产品创新及工程实施。

我们今天看到的百度搜索、百度翻译等产品的变化,以及度秘等新产品的诞生,在用户体验的感受差异中,实际是神经网络、语音识别和知识图谱等等技术的理性呈现。其实这些就是学术和产业之间产生的化学反应。搜索引擎源源不断产生出的数据,加上王海峰团队在学界的先行经验,最终构成了百度在人工智能方面的技术优势。

相比BAT其他的人工智能大牛,王海峰相对低调,大概这也是“工程派”的特征之一。但他和他的团队的确为百度后续诸多产品的智能化奠定了基础,属于百度AI中的隐形部队。正因为百度AI技术平台体系发展脉络始终清晰有序,才有了从底层打造平台、开放生态的能力,接入更多产品化和工程化端口。在人工智能的长线战争中,工程化和产品化能力可以为百度赢得更多优势。

优秀的科学家、丰富的数据源和业务落地场景三个元素单独存在时都很难构成显著的优势,但三者结合后,带来的能量就不容小觑了。

(教机器人叠毛巾的Pieter Abbeel)

提到强化学习,大多数人会认为这是一项距离现实非常遥远的技术,不过一直有人在尝试着把这一技术带到现实,Pieter Abbeel就是其中之一。

在博士时期,Pieter Abbeel就与导师一同提出了师徒学习这一强化学习中的重要概念。在伯克利任教期间,还因让机器人通过强化学习学会叠毛巾获得了MIT颁发的TR35奖项。后来入职马斯克的OpenAI,推出了著名的机器人训练场Gym。Gym虽然也还是一个仿真环境,但本质来说已经是在为强化学习应用在实际场景中做出准备。尤其当场地、费用、用时这些问题成为强化学习落地训练的阻碍时,仿真环境的出现让很多团队可以在低成本的前提下快速训练智能体。

Pieter Abbeel自己已经把强化学习机器人带入了商业领域,直到今天,硅谷机器人制造商Willow Garage的很多产品中还有Pieter Abbeel利用强化学习训练的成果。如今Pieter Abbeel已经离开OpenAI,创立自己的团队,专注于利用强化学习让现有硬件设备自主学习完成任务。

自动化的普及度不断增高的过程,本质上也是机器人训练成本不断降低的过程,强化学习的应用的落足之处也在其中。

革命来临前夜,天秤两端的学与业

以上三位科学家仅仅是人工智能领域众多传火者的一个缩影,却也能让我们管中窥豹,领悟到一点人工智能产业发展的势头。

有一些生物学界的人士曾经对这次人工智能浪潮做出过忠告,说今天的人工智能特别像十几年前的生物学,论文满天飞、大学猛开专业、专家教授纷纷“下海”创业。最后生物学却因为产业化能力不足,反倒湮灭了学术界的星星火光。而人工智能被称为下一次工业革命,自然要把“学”和“业”放在天秤的两端。

“学”的能力,既包括了论文数量、竞赛排名,也需要考量技术的创新型和实用性。

像现如今大火的DeepMind,他们发表的很多关于深度学习的论文中并没有利用太多超前的方法论,而是引源上个世纪的认知科学方法,用来解决今天的现实问题。

至于“业”的方面,往往要看技术的根扎在哪里。学术能力当然可贵,但仅仅依靠学术很难支撑起人工智能未来的宏图。以上三个案例中,科学家们虽然都出身象牙塔和实验室,但也都是典型的工程派,把技术的根基深深的扎在了大企业和应用产业中。广泛的业务和广泛的应用场景意味着源源不断的现实数据,以此吸取的养分,才能让科学家们在仿真世界研发出的模型无限适用于物理世界,让技术切实影响到人们的生活。把工业革命的火种带到现实中来。

不过我相信人工智能产业很难重蹈生物产业的覆辙,一个显著的苗头就是,人们正在对天秤严重失衡的企业失去信心。比如此前的智能音箱风潮,市场上已经看不到前两年对智能手环一类产品的热情,反而换来了不少对智障音箱的嘲讽。又比如一直强调自己学术背景的科大讯飞,最近也因为落地场景匮乏而饱受争议。

历经了从“.com”时代的几次泡沫,我们已经越来越清楚自己想要的是什么,对于空中神殿的勾勒的确迷人,可想要真正改变现状,还需一次火种的传递。

时间: 2024-10-08 00:10:09

李飞飞、王海峰……悉数那些人工智能领域的传火者的相关文章

王海峰领衔百度研究院升级,巨头AI战正式跨入下一幕

年关岁末,各种各样的总结和展望开始多了起来. 这两天的热门话题之一,是BAT三家的AI布局统计和对比,各种各样的文章都在从不同角度讨论三家的优势劣势和各自特点,拼生态.拼场景.拼用户心智,各种各样的观点蜂拥而来. 但这里想说的是,很可能在产业图谱之外,我们其实忽略了AI领域真正比拼的东西:作为一种不断前进,始终处于探索中的技术,AI产业间的核心竞争力,其实始终都在学术研究能力上. 如何构建从实验室到商业场景的最快速通道,如何让产学真正一体化,或许才是AI时代争夺战的源点--这也是BAT到欧美巨头

2017年度好视频,吴恩达、李飞飞、Hinton、OpenAI、NIPS、CVPR、CS231n全都在

我们经常被问:机器翻译迭代了好几轮,专业翻译的饭碗都端不稳了,字幕组到底还能做什么? 对于这个问题,我们自己感受最深,却又来不及解释,就已经边感受边做地冲出去了很远,摸爬滚打了一整年. 其实,现在看来,机器翻译在通用领域的短句上,已经做得不错了,但是复杂长句.需要结合上下文语境.特定知识的翻译上,效果还远远不能让人满意. 人工智能领域的翻译,就属于后者.它不仅需要数学.编程知识打底,对特定专业表达进行界定,还需要适时结合上下文语境理解和延伸. 这样一来,你也许能够理解,忠于原意又有人情味的翻译很

李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程

目前,深度学习和深度强化学习已经在实践中得到了广泛的运用.资源型博客sky2learn整理了15个深度学习和深入强化学习相关的在线课程,其中包括它们在自然语言处理(NLP),计算机视觉和控制系统中的应用教程. 这些课程涵盖了神经网络,卷积神经网络,循环网络和其变体,训练深度网络的困难,无监督表示学习,深度信念网络,深玻尔兹曼机器,深度Q学习,价值函数估计和优化以及蒙特卡洛树搜索等多种算法的基础知识. 吴恩达:深度学习专项 这系列课程侧重于讲解深度学习的基础和在不同领域的运用方式,如医疗健康,自动

王海亚:淘宝交易系统演进之路

淘宝的交易系统承载了购物车.下单.订单管理等多项淘宝的重要业务,随着淘宝业务量的不断上升,交易系统也随之几经改造.InfoQ此次专访了阿里巴巴架构师王海亚,另外作为ArchSummit深圳2014大会<电商,各走各的路>专题的讲师,王海亚将会分享淘宝交易平台的架构演变及并行化实践.以下为专访全文: InfoQ:淘宝的交易系统,主要承载了哪些业务? 王海亚:从用户视角来看,交易承担了购物车.下单.订单管理这些功能:从功能视角来看,交易系统包括做业务规则和服务整合的交易平台以及支撑交易功能的底层服

&quot;中国打假第一人&quot;王海:莆田系把犯罪当事业做

魏则西事件使得莆田系医疗机构成为众矢之的.而作为“中国打假第一人”,王海18年前就开始对莆田系医疗机构进行调查,当年在为客户调查一宗假药案时,他顺藤摸瓜发现了莆田系的隐秘帝国及医疗欺诈等问题.然而,那场由王海点燃的打击性病游医风波,对莆田系在全国的扩张造成一定打击,但他们却并没因此销声匿迹.相反,还转型升级,进一步发展壮大. 昨日,王海接受了华商报记者的专访. 18年前因打击假药关注到莆田系 华商报:18年前,你为什么会关注到莆田系? 王海:当年我们在打一种叫“淋必治”的假药,其实就是用氟哌酸伪

王文峰《人脸识别原理与实战以MATLAB为工具》PDF及代码+《人脸识别原理及算法(沈理)》PDF+学习参考

人脸识别是当今世界科技领域攻关的高精尖技术.<人脸识别原理及算法:动态人脸识别系统研究>系统介绍了人脸识别研究领域的研究状况以及作者在人脸识别领域的研究工作和研究成果,全书共分为3个部分. <人脸识别原理与实战以MATLAB为工具>作为该技术的进阶指南,在内容上尽可能涵盖人脸识别的各技术模块,立足于作者 在中国科学院.985工程大学国家重点实验室从事视频识别与智能监控项目开发的研究积累及实战体验,分享了作者对人脸识 别算法设计的一些最直观的感触和认识. 参考学习: <人脸识别

人工智能领域中声源定位的研究与发展------第一章 绪论

1.1 引言 在人工智能领域中,听觉与视觉相比,仍旧处在一个初期阶段的研究课题.随着时代的发展,听觉已经成为人工智能领域中重要的研究课题.它是智能机器人的重要标志之一,也是实现人机交互,与环境交互的重要手段. 在之前机器人的导航主要使用测距传感器(如声纳),而跟踪和定位主要靠视觉.这种形式在视觉场景内被广泛作为定位目标的方式.但是像人和大部分动物那样,视觉场被限制在小于180度的范围内.在真实世界中,听觉能带来360度的"听觉场景".它能定位不在视觉场景内的声音目标,即定位由物体遮挡造

在计算机视觉与人工智能领域,顶级会议比SCI更重要(内容转)

很多领域,SCI是王道,尤其在中国,在教师科研职称评审和学生毕业条件中都对SCI极为重视,而会议则充当了补充者的身份.但是在计算机领域,尤其是人工智能与机器学习领域里,往往研究者们更加青睐于会议 我无意否认SCI期刊的价值,但是在机器学习.计算机视觉和人工智能领域,顶级会议才是王道.有人会质疑这些会议都只是EI索引的.是的,这的确非常特殊:在许多其它领域,会议都是盛会,比如society of neuroscience的会议,每次都有上万人参加,带个abstract和poster就可以去.但在所

Paddle 教程:人工智能领域深度学习平台

百度开源了其深度学习平台Paddle,引发了挺多人工智能领域开发者的兴趣,包括一些之前一直在Tensorflow和Caffe上练手的开发者.不过鉴于深度学习的开源平台目前并不多,作为开发者也作为热心吃瓜群众的头等大事,就是想知道——这个平台怎么样?别人怎么看这个平台?以及这个平台跟Tensorflow以及Caffe有何区别? 这个平台本身怎么样 Paddle本身在开源前就一直存在,始于2013年的时候,因为百度深度实验室察觉到自己在深度神经网络训练方面,伴随着计算广告.文本.图像.语音等训练数据