12月14日的谷歌开发者大会上,身着红衣的李飞飞不仅激荡起了台下的掌声,还成为了各路媒体报道中讨论的焦点。这不得不让人感叹,我们又回到了崇拜科学家的时代。
或许是因为人工智能本身就是一个学术话语权极强的领域,现在的AI企业不管体量大小,往往都有教授、专家坐镇,发布论文的数量和学术竞赛排名,似乎也成了考量企业技术含金量的标准。
可问题的关键是,我们不仅优秀的科研成果,更需要能把技术从论文中带到我们身边的传火者。今天就来谈谈,怎样才能称得上人工智能领域的传火者。
论文产品化:象牙塔内外的海水与火焰
很多人的概念里都存有一个误区,论文发的多、专利申请的多、竞赛排名足够高就意味着技术有着更高的实用性和商业前景。学术上的持续探索当然是人工智能能不断进步的基础,但从论文到产品、再到优秀的产品,这期间的里程往往比我们想象中要遥远得多。
不管是论文还是赛事,往往都会给出一个理想的恒定实验环境来追求某一项技术的极致可能。比如给出统一的硬件标准或数据库,而得出的结果也是在某一标准下的最佳结果。
这就导致一种尴尬的结果:有时论文会走向一种非常刁钻的方向,很难实际应用在生活中。像是耗费大量计算资源去追求极小的模型压缩,或是牺牲计算速度去在极小范围内提升模型准确率。但这些研究成果往往只能在仿真环境中起作用,要想应用到现实中来,往往会遇到这样那样的问题。
现在很多技术模型都是开源共享的,将公开的模型进行参数调试,从一个领域移植到另一领域并不难,可想要实现产品化,就要为模型寻找到合适场景,嵌入到适用的软件或硬件中。在这一过程中,如何面对技术开源,难以建立壁垒的问题就是一个难点。
即使把技术成功产品化,也要考量产品的实际应用性。人工智能技术的加入是不是真的能提升用户体验,体验的提升和所耗费的成本之间是否又能找到平衡点……很多时候,人工智能产品还未经市场检验,就已经折戟在论文产品化的过程中了。
论文和排名仅仅是人工智能产业的一部分,我们不能否认它的价值,但也要保持清醒的头脑。有些企业靠这些可以拿到大笔融资,但这绝不是企业成功的标志。过往,论文和会议竞赛中的技术存在于科研环境中,代表的是人工智能无限的可能性。幸好,如今科学家们纷纷走出了象牙塔,把技术从仿真世界带到物理世界,向我们展示人工智能的应用性。
把目光投向物理世界,
学术力量落足在哪?
在今天的人工智能热潮中,既然有人靠水论文拿融资,自然也会有人可以成为技术的传火者,把学术能力化为产品能力甚至商业能力,成为人工智能时代的“传火者”。
(帮谷歌AI连接中国的李飞飞)
抛开谷歌的光环,从加州理工毕业的李飞飞自身也有着极高的学术起点,在斯坦福实验室中的身体力行培养出了不少牛人,也凭着TED上强大的演讲能力吸引了不少人关注计算机视觉领域。
李飞飞对人工智能领域最大的贡献无疑是创立了世界上最大的图片识别数据库ImageNet。此前机器学习一直饱受过拟合和泛化的困扰,学界一直试图在模型上寻找解决方式,直到李飞飞开始主导ImageNet的研究,从数据集入手试图改变游戏规则。
ImageNet的影响力越来越大,甚至从中诞生了卷积神经网络这样实用性极高的技术,计算机视觉和深度学习也越来越多的应用在物理世界中:社交网络的图像标注、自动驾驶的物体监测……包括李飞飞自己在谷歌街景上添加的种种功能,如通过分析汽车分析街区政治倾向等,在CV和产业结合中缔造了更多想象空间。
大量的落地应用也再不断的向CV技术提供反馈,物理世界的技术应用也催化了仿真世界中技术的发展。
(为百度布局AI的王海峰)
NLP和CV两个领域,都聚集了大量华人科学家。在学界和产业界都有布局的,王海峰算是其中一个典型。
王海峰在学界的成就很高,是迄今为止国际计算语言学会(The Association for Computational Linguistics)唯一出任过主席的华人,也是首位来自大陆的会士。还曾获国家科技进步奖及创新争先奖等等。
2010年王海峰入职百度,百度也给了他很大的发挥空间。他先后为百度开拓并发展了自然语言处理、知识图谱、深度学习、语音技术、图像技术等多个技术方向,并在2013年上半年作为执行负责人协助创建了百度深度学习研究院(IDL),这些开拓性工作奠定了百度人工智能的基础。在担任百度搜索业务群组任副总经理期间,王海峰总负责百度搜索引擎、信息流、手机百度等百度最核心的业务,并打造了小度机器人、度秘等新的明星产品。从这些动作就能看出,王海峰不仅科研能力突出,还很善于产品创新及工程实施。
我们今天看到的百度搜索、百度翻译等产品的变化,以及度秘等新产品的诞生,在用户体验的感受差异中,实际是神经网络、语音识别和知识图谱等等技术的理性呈现。其实这些就是学术和产业之间产生的化学反应。搜索引擎源源不断产生出的数据,加上王海峰团队在学界的先行经验,最终构成了百度在人工智能方面的技术优势。
相比BAT其他的人工智能大牛,王海峰相对低调,大概这也是“工程派”的特征之一。但他和他的团队的确为百度后续诸多产品的智能化奠定了基础,属于百度AI中的隐形部队。正因为百度AI技术平台体系发展脉络始终清晰有序,才有了从底层打造平台、开放生态的能力,接入更多产品化和工程化端口。在人工智能的长线战争中,工程化和产品化能力可以为百度赢得更多优势。
优秀的科学家、丰富的数据源和业务落地场景三个元素单独存在时都很难构成显著的优势,但三者结合后,带来的能量就不容小觑了。
(教机器人叠毛巾的Pieter Abbeel)
提到强化学习,大多数人会认为这是一项距离现实非常遥远的技术,不过一直有人在尝试着把这一技术带到现实,Pieter Abbeel就是其中之一。
在博士时期,Pieter Abbeel就与导师一同提出了师徒学习这一强化学习中的重要概念。在伯克利任教期间,还因让机器人通过强化学习学会叠毛巾获得了MIT颁发的TR35奖项。后来入职马斯克的OpenAI,推出了著名的机器人训练场Gym。Gym虽然也还是一个仿真环境,但本质来说已经是在为强化学习应用在实际场景中做出准备。尤其当场地、费用、用时这些问题成为强化学习落地训练的阻碍时,仿真环境的出现让很多团队可以在低成本的前提下快速训练智能体。
Pieter Abbeel自己已经把强化学习机器人带入了商业领域,直到今天,硅谷机器人制造商Willow Garage的很多产品中还有Pieter Abbeel利用强化学习训练的成果。如今Pieter Abbeel已经离开OpenAI,创立自己的团队,专注于利用强化学习让现有硬件设备自主学习完成任务。
自动化的普及度不断增高的过程,本质上也是机器人训练成本不断降低的过程,强化学习的应用的落足之处也在其中。
革命来临前夜,天秤两端的学与业
以上三位科学家仅仅是人工智能领域众多传火者的一个缩影,却也能让我们管中窥豹,领悟到一点人工智能产业发展的势头。
有一些生物学界的人士曾经对这次人工智能浪潮做出过忠告,说今天的人工智能特别像十几年前的生物学,论文满天飞、大学猛开专业、专家教授纷纷“下海”创业。最后生物学却因为产业化能力不足,反倒湮灭了学术界的星星火光。而人工智能被称为下一次工业革命,自然要把“学”和“业”放在天秤的两端。
“学”的能力,既包括了论文数量、竞赛排名,也需要考量技术的创新型和实用性。
像现如今大火的DeepMind,他们发表的很多关于深度学习的论文中并没有利用太多超前的方法论,而是引源上个世纪的认知科学方法,用来解决今天的现实问题。
至于“业”的方面,往往要看技术的根扎在哪里。学术能力当然可贵,但仅仅依靠学术很难支撑起人工智能未来的宏图。以上三个案例中,科学家们虽然都出身象牙塔和实验室,但也都是典型的工程派,把技术的根基深深的扎在了大企业和应用产业中。广泛的业务和广泛的应用场景意味着源源不断的现实数据,以此吸取的养分,才能让科学家们在仿真世界研发出的模型无限适用于物理世界,让技术切实影响到人们的生活。把工业革命的火种带到现实中来。
不过我相信人工智能产业很难重蹈生物产业的覆辙,一个显著的苗头就是,人们正在对天秤严重失衡的企业失去信心。比如此前的智能音箱风潮,市场上已经看不到前两年对智能手环一类产品的热情,反而换来了不少对智障音箱的嘲讽。又比如一直强调自己学术背景的科大讯飞,最近也因为落地场景匮乏而饱受争议。
历经了从“.com”时代的几次泡沫,我们已经越来越清楚自己想要的是什么,对于空中神殿的勾勒的确迷人,可想要真正改变现状,还需一次火种的传递。