最近我们一直在探讨这样一个问题:为什么AI飞速发展,普通人还是觉得距离AI非常遥远?
实际上,推而广之这可能不单单是媒体和技术爱好者的疑问。上升到更大的国家与社会经济层面,对真实可用、能快速见到实效的AI需求已经十分迫切。
从“新一代人工智能”政策出台,到国家AI创新开放平台公布首批名单,再到近期工信部发布三年规划,可以看到政策层面一直在将AI向实用化、产业化、融合化方向推进。换言之,如何让浮在实验室与测试数据中的AI技术,走到现实世界和我们的生活当中,显然已经足够急迫了。
今天很多媒体都报道了,在刚刚结束的2017云栖大会·北京峰会上,阿里云发布了堪称迄今为止最全面的阿里AI版图。
但在阿里复杂的AI业务、产品和合作生态背后,也许我们能够发现一个关键词:产业AI。
产业AI到底和其他AI有什么不同?让阿里举重兵投入的道理何在?在一片技术喧嚣和话语迷雾里,AI走进我们的生活时究竟会是什么样子?
今天我们或许可以从一些小故事里,来回答这些问题。
什么才是产业AI?
开始故事之前,我们要先回答这样一个问题,虽然这个问题看起来像….废话….但是没办法,真相往往跟我们的想象或多或少有点不同。
顾名思义,产业AI当然是在具体的一个个产业里发挥作用的AI技术和产品咯。也就是我们经常说的AI赋能传统行业。但有点不同的是,我们在讨论AI赋能行业,或者所谓“AI+”的时候,往往设想的是以AI为主体,来实现某个领域的固有功能。比如一些AI+教育平台,就是用AI的语音交互和NLP能力,来实现远程教育功能。
在这种情况下,我们思考的是用AI替代,而不是用AI结合。它能改善一些情况,却无法真正提高这个产业本身的效率,降低原始成本,更不能融合在整个产业线之中。
所以真正的产业AI,必须是能够与传统产业无缝结合,推助这个产业核心部类向前发展的。这也是阿里云从ET大脑到产业AI布局的根本诉求。尤其需要注意的是,深度的产业AI必然指向复杂的行业限制和真实需求,往往比简单的AI替代论复杂很多。
比如说想让AI来计算机场的停机坪使用情况,提高停机坪的使用效率。听起来蛮简单的一件事,但是一名真正的机场调度员,却需要考虑航班号、机型、国际国内分类、近机位优先原则、机上状况、航空公司情况、机场建设状况、流量状况、延误航班对下序航班的影响、天气状况等等十几个因素才能决定飞机停泊的机位。假如AI系统只算了其中一两个,漏算了某些因素,岂不是耽误了大事?
所以说,产业的需求往往比我们一般想象中复杂太多,综合来看,AI想解决产业问题,必须具备四个方面的基础能力:
1.多维感知能力:真实世界中,数据和信息常常是从几个方向混杂过来。假如AI只能听、只能看,或者只能连接数据库,那么它就会变成盲人摸象型AI。只能用来炫耀某种能力,却无法真正投入使用。
2.全局洞察模式:能感知之外还要能分析和归纳,就像上面说的运算停机坪。AI必须综合各方面信息和实时变化的数据流,随时做出统领全局的最优解。这就是我们所说人类的大局观。没有大局观的人不能胜任管理,没有大局观的AI也是一样。
3.人机协同体验:想做产业AI,必须承认的一点是今天的AI绝不可能,也不希望彻底取代人类。必须是人机协同的工作模式,但是人机如何协同,如何在缩减人的工作时间,提高人的工作效率之外,不会浪费大量学习成本和适应成本,也是关键问题。
4.持续进化能力:日新月异的工作,必须让人不断去适应和学习新的工作方式,对于AI也是一样,如果产业AI不能进化,那么工作需求一旦变更AI就变成废铁一块,那确实不要也罢。
为了解决这四个很让人挠头的问题,阿里云的解决方案是构建了目前为止世界上最大的综合智能体:ET大脑。
在阿里强大的计算能力、数据优势加持下,ET大脑可以适应各个行业的感知、洞察、进化需要,满足不同的智能运算需求。
这背后隐藏着这样一个现状:必须有算力、数据、算法三者的有效结合,才能有AI在复杂场景里展开与原始产业体系合作的可能性,才能达成所谓的场景。阿里云能最快布局产业AI,可能原因也在于此。
但是这可能还不够,产业AI之路,绝不是单纯的技术能力可以搞定的。
到底该如何打造产业AI?
如果你身处一个比较传统的行业,不妨想想,假如为你安排一位超级智能的AI助手,你的第一反应是什么?
很兴奋?那么第二反应呢?大概是感觉学起来很麻烦,不知道到底好用不好用,担心成本和收益不相符,等等等等。
这是没有办法的,人在面对新事物时的先验反射永远都是排斥和怀疑。尤其是AI这种先天具有科幻色彩的技术与产品。所以说,实验室和PPT上的AI是相对容易的,但产业AI却要更复杂。其复杂程度很多时候不在于单纯的技术挑战,而在于需要复杂且长期的企业合作、谈判沟通和对细节的苛求。总之,都是苦差事和累差事。
这几天与阿里云的专家们沟通,听了不少故事。从这些故事中,可以把阿里打造产业AI的秘密归纳为三个方面:
一、深入场景的具体需求当中。很多AI技术走进现实时,往往会太重AI太轻现实,这样做的直接结果是完全低估了产业化进程的难度。
比如阿里云在打造ET工业大脑的时候,面对的都是已经二三十年的老机器。这些机器怎么AI?怎么能够不给企业成本压力,如何让老工厂的工人懂得使用?可能都是科学家一般不会思考的问题,却真实阻挡了工厂的AI化。而阿里云的解决方案蛮简单粗暴的:直接派工程师在车间蹲守,一台台机器去琢磨和收集数据,貌似这在科技企业中是第一份。据说第一个试点企业最开始也是拒绝尝试工业大脑的,于是阿里云决定免费安装。结果很快给企业节省了几千万的成本,然后企业主动要求付费……可以想见,不深入场景和产业的AI是很难真正进驻产业化的,而这对AI企业的团队和执行力要求其实远超想象。
二、以行业从业者为核心思考问题。我们时长忽视的一个问题,是AI技术有时候并不能讨人喜欢。看似有道理的技术解决方案,在真实产业场景里其实是无效的。
比如阿里云的AI语音解决方案与法院场景的合作。一般我们理解法院使用语音交互,无非就是对庭审进行记录,代替书记员的工作。但事实上却不是这么回事,直接将庭审对话转换成文字,夹杂了大量的口语内容,根本是无效记录,反而加大了书记员工作的难度。阿里云智能语音提供的解决方案,是通过AI智能理解文本、抽取逻辑将庭审记录简化,这才能真正帮到书记员。
所以说,真正的产业AI必须以从业者为核心去思考问题,这需要对产业深度的理解,以及关键领域的产业深度合作。比如刚刚发布的最新ET航空大脑。这个“新大脑”将在首都机场开工。为首都机场300个停机位,每天迎来送往1700架次航班提供智能决策和运算。上文已经说过了这个运算的难度,但ET航空大脑50秒时间就可以排完整个任务,并且全程可视化,受到工作人员的监督和调整。
三、运用一切办法解决问题。最后一种产业化中必须面对的问题,是真实问题往往比实验与测试中复杂很多。必须要突破技术领域的限制,也不能等待技术成熟,而是选择运用一切办法解决问题。比如阿里云即将在上海推出的首个AI地铁售票机,就可以让用户用语音交互的方式买地铁票。但在地铁这么嘈杂的环境里,语音识别实在过于复杂。阿里云最终的解决方案,是加强收音阵列硬件的同时,用机器视觉技术识别人脸和嘴唇,让售票机听到兼看到买票者,才能最终解决问题。
这三条途径,归根结底是巨大的产业合作任务和工程化工作量。在具备技术基础的同时,还要求执行企业有强大的沟通能力、工程化能力和个案攻坚能力。
这是一条不好走的路,但是总归要有人走。
一个发现:产业化路途中的AI新战场
通过ET大脑的中枢系统汇聚点,以及背后算力、算法、数据上的积累,阿里迄今为止发布了城市、工业、零售、金融、汽车、家庭等六个场景的“产业AI”方案。这些能力、产品和解决方案,会阿里云为出口进入于各行各业。
从ET大脑的原点到今天的生态版图,阿里的“现实主义AI”,也在AI场景争夺战中保持了自己很多层面的优势。比如:
1.全面的场景,持续进化能力与良性合作习惯。从工业、交通,到环境、航空,ET大脑的布局逐渐向全景化、垂直化双向发展。带来的结果很可能是覆盖了经济民生关键感知端口的AI系统,可以运用这些场景能力通向整体进化。而良好的产业合作步伐,则给升级能力带来了进一步出口。场景、技术和合作,正在形成阿里AI的递增三角关系。
2.可复制,甚至生态复制的AI解决方案。从航空大脑的案例中不难看出,ET大脑的解决方案和能力基础是具备高度复制化的。当一个领域需要复杂的运算,多种感知数据的结合,并且人工效率始终很低,那么就可以自发引入ET大脑。这种领域在生活中相当多见。当ET大脑的产业AI解决方案复制到某个量级时,生态性、泛在化的产业AI自发衍生或许将会出现。
3.关键领域的直接价值。工业、医疗到交通航空,阿里的产业AI系统在不断提高覆盖面的同时,更为各个关键领域带来了直接的效率提升和成本缩减。由高速的产业合作效率与直观的价值体现,阿里AI会在同类企业的竞争中获得先发优势。
当产业AI在国家和社会需求的推动下,必然成为下一幕竞争焦点的时候,依靠这些领域的优势,阿里AI也许会在新战场有所收获。
当然,最重要的是,让AI能用,有用,普通人乐于去用,是这个技术不会变成另一个泡沫的根本保障。