在2016年5月底的全国科技创新大会上,华为公司创始人、总裁任正非发表了著名的“华为进入‘无人区’”讲话。任正非说,华为“正在本行业逐步攻入无人区,处在无人领航、无既定规则,无人跟随的困境”,“已感到前途茫茫,找不到方向”。
任正非又说:“从科技的角度来看,未来二、三十年人类社会将演变成一个智能社会,其深度和广度我们还想象不到。”在2016年8月12日,由中国计算机学会(CCF)主办、雷锋网承办的“全球人工智能与机器人峰会(简称CCF-GAIR)上,亮相了一批巨头们进击人工智能与机器学习、探索“无人区”而尝试的技术、项目和科研成果。
华为诺亚方舟实验室、小米探索实验室、腾讯优图实验室、360 人工智能研究院、百度自动驾驶事业部、微软亚洲研究院等,以及牛津大学计算机系、卡内基梅隆大学国家机器人工程中心、MIT机器人实验室、加拿大皇家学院等学术科研机构代表等阐述了对未来的理解。
人工智能大势不可挡
2016年并不是简单的人工智能60周年,也不是简单的AlphaGo人机大战激发全球新一轮人工智能的“幻想”。这一年,人工智能从漫长的学术研究周期迅速进入到产业化阶段。
就在2016 CCF-GAIR开幕的前两天,曝出了英特尔3.5亿美元收购人工智能AI创业公司Nervana Systems的消息。据称,Nervana Systems深度学习芯片的性价比高于GPU,处理速度是GPU的10倍等特点。业界惊呼,在AI战场上英特尔与NVIDIA两个芯片巨头直接开战。
就在8月初,NVIDIA刚发布了新一季财报,其中营收比去年同期增长24%、净收入比去年同期增长873%,而业务大幅增长的背后就是互联网企业等大规模地在数据中心里部署NVIDIA GPU用于完成AI相关计算任务。由于GPU的大规模并行计算能力,因而成为AI计算任务的首选。2016年7月,NVIDIA的首款深度学习服务器DGX-1开始上市销售。
面对NVIDIA对于英特尔在数据中心市场的威胁,英特尔也不会坐视不理。英特尔刚刚在今年6月的ISC国际超级计算机大会上,推出了代号为Knights Landing(KNL)的第二代至强融核处理器,这系列最高达72核的x86 CPU也是首款可作为独立处理器的Xeon Phi产品,这意味着可摆脱GPU而组成CPU-Only的高可扩展机器学习机群。
芯片设计巨头ARM通过7月中旬被软银的并购,将借助软银的资本以及生态实力抢在物联网产业大涨潮之前布局低功耗智能物联网芯片市场。ARM于今年2月推出了新处理器架构设计,主要针对5G以及大容量存储SoC嵌入式设备,为未来的AI普及打下基础。5月,AMR亦斥资3.5亿美元收购了计算机视觉技术提供商Apical。
除了底层的基础芯片技术外,在应用层面也可判断人工智能大趋势已经形成。7月28日,国内人工智能PaaS平台图灵机器人对外透露,图灵机器人PaaS平台在过去8个月新增了162亿次的服务请求,开发者在8个月内新增1.1倍、总数量超过23万。7月推出的智能机器人操作系统Turing OS1.5将新增11个视觉能力,包括人脸识别、人脸检测、人脸跟踪等多项视觉技术。
除了图灵机器人PaaS平台外,IBM公司借助Bluemix PaaS平台在华的落地,也把认知计算Watson的服务相继带到了国内,微软也相继在今年推出了体系化的人工智能认知计算服务,更不用说谷歌今年IO大会上推出的智能搜索引擎以及智能硬件Google Home,阿里云提出大数据AI是未来的战略发展方向等。
可以说,人工智能产业化的第一次大涨潮已经到来!
华为能否创造诺亚方舟?
(上图为华为诺亚方舟实验室负责人李航)
华为早在2012年就在香港成立了诺亚方舟实验室,第一任实验室主任由香港科技大学教授、人工智能和数据挖掘专家杨强担纲。该实验室的研究方向包括:自然语言处理和信息检索、大规模数据挖掘和机器学习、社交媒体和移动智能、人机交互系统、机器学习理论等。
华为诺亚方舟实验室是华为2012实验室研究组织的组成部分。据称华为2012实验室的名字来自于任正非观看《2012》电影后认为未来信息爆炸会像数字洪水一样,华为要构造自己的“诺亚方舟”。2012实验室的主要研究的方向包括新一代通信、云计算、音频视频分析、数据挖掘、机器学习等,主要面向的未来5-10年的技术研究。
华为诺亚方舟实验室第一任主任杨强教授在2016 CCF-GAIR峰会上介绍了自己的主要研究方向:迁移学习。简单理解,迁移学习就把已经训练好的人工智能模型迁移到新的应用场景或数据集中。当前以人工神经元网络为主的深度学习算法已经相当成熟,但每个人工神经元网络模型都与初始数据集高度相关,一旦换到新的应用场景或数据集就必须从头再训练模型。迁移学习就致力于以较小的代价让已经训练出的人工智能模型具有普适性和通用性。
换句话说,把一个已有模型迁移到一个未知领域,这就叫做迁移学习。在人类社会里,把已有知识用于新的相关领域就是知识的转移,比如从学骑自动车到学骑两轮摩托车等。从这个角度看,迁移学习是通用型AI的前提和基础。迁移学习还可以把从大数据集中训练出的模型,迁移到小范围的数据集上,从而创造了更好的个性化。
华为诺亚方舟实验室第二任主任、北京大学和南京大学兼职教授李航在2016 CCF-GAIR峰会上表示,诺亚方舟实验室还围绕华为的智能手机、服务器、数据中心产品与设备等展开大数据与人工智能的研究工作,为华为三大BG事业群聚焦前沿产品开发,例如智能通讯网络、企业BG大数据应用、消费者BG的智能语音助手等。
除了诺亚方舟实验室外,“2012实验室”旗下有多家以世界知名科学家命名的实验室,包括香农实验室、高斯实验室、谢尔德实验室、高斯实验室、欧拉实验室、图灵实验室等,以及在欧洲、印度、美国、俄罗斯、加拿大、日本设立的8个海外研究所。据报道,华为今年还将在深圳设立10个基础研究所。
通过这些基础研究机构和研发组织,华为正试图探索无人区、为创造未来的华为打下基础。尽管华为对研发的投入保持在年收入的15%-20%左右,但像诺亚方舟实验室这样的基础研究性机构也仅成立了4年的时间,相比于微软研究院25年的历史、IBM研究机构80年的历史来说,华为的基础性研究才刚刚起步。
现在,华为的挑战是如何管理大规模的基础性研究组织。
小米对人工智能的探索
(上图为小米科技联合创始人、小米探索实验室负责人黄江吉)
相对于华为四年前开始投入前沿科技研究来说,小米的起步从2016年初开始。2016年1月15日,小米科技创始人兼CEO雷军在内部年会上表示,小米2016年要组建特种部队,突破核心元器件的关键技术,并宣布成立小米探索实验室研究VR/机器人等前沿科技。2016年2月,小米探索实验室成立。
小米科技联合创始人、小米探索实验室负责人黄江吉在2016 CCF-GAIR峰会上表示,小米对于人工智能的观点是:产品+大数据+机器学习。也就是说,小米的人工智能观点是紧密结合智能手机、智能硬件等产品的。黄江吉以智能硬件内嵌的Wi-Fi模组为例,小米通过自己的研发把Wi-Fi模组价格从60多元降到了10元,这就打下了硬件产品“智能”的基础。
现在,每天有200TB+的数据流入小米云,这背后就是无处不在的Wi-Fi硬件在源源不断产生高质量的数据。只有掌握高质量的大数据,才有可能通过机器学习创造真正的人工智能。在这个过程中,每天的活跃用户数据也很重要。黄江吉表示,小米MIUI系统每天日活超过1000万的APP有8个、超过100万的APP有17个。
小米手机、小米手环、小米电视与盒子、小米网络设备、小米智能家庭设备等,再加上小米电商、小米互娱、小米市场和生态链等,构成了小米全生态、多样性的大数据资源。小米大数据处理呈金字塔结构,最下面是数据采集,往上依次是数据清洗、数字挖掘和数据智能。
围绕小米大数据可以生成高质量的用户画像,有的用户指标甚至无需用户输入就能精准推断出来;还可以生成一站式、标准化与规范化的内容数据,结合用户画像形成包括视频、音乐、商品、游戏、APP、小说、新闻等在内的内容池,为搜索、推荐、导流和人工运营服务。
黄江吉介绍小米的数据处理包括底层架构层的Hadoop基础平台以及数据工厂,向上基础能力层的机器学习(深度学习)、视觉识别、NLP自然语言处理和语音识别等,再向上的大数据层则包括业务数据、用户画像和内容池,高级能力则有商业智能、搜索、推荐、智能问答和图像等,最终对接各类小米智能硬件产品。
具体到小米的深度学习平台,在硬件层是公有云和本地数据中心的GPU机器,GPU集群管理采用的是Kubernetes+Docker、深度学习任务管理采用的是TensorFlow,存储服务则采用HBase/HDFS系统、计算服务采用的是Spark/Storm/MR系统,对接到智能助手、云相册、广告、金融和搜索推荐等小米业务。
黄江吉表示,优秀的产品能黏住用户、用户能生成高质量的大数据、大数据通过机器学习产生人工智能、人工智能再反馈给产品设计,这就是小米的人工智能观点。比如小米面孔相册的总用户数已达1.5亿人、照片存储量达500亿,这么大规模的大数据帮助小米更好的优化面孔相册产品。黄江吉强调,过去的观念是“好用的产品不一定好玩,好玩的产品不一定好用”,而随着人工智能和机器学习的发展,有可能把产品做的既好玩又好用。
在被问及对人工智能产品的看法时,黄江吉举例说现在人们每天都要无数次打开手机看信息或完成某个功能,这本身就说明智能手机产品还不够智能,真正的智能手机产品是要大幅减少人们打开手机的次数与看手机的时间,因为很多工作都会被智能手机“智能化”地完成了。
尽管当前小米神话进入了平台期,但可以说智能手机时代其实才刚刚开始。
百花齐放的AI生态
(上图为百度高级副总裁、自动驾驶事业部总经理王劲)
任正非说,“越是前途不确定,越需要创造,这也给千百万家企业公司提供了千载难逢的机会。”
搜狗于今年4月22日向清华大学捐赠1.8亿元人民币,联合成立“清华大学天工智能计算研究院”,深入开发包含人工智能在内的前沿技术。搜狗CTO杨洪涛在2016 CCF-GAIR峰会上表示,搜索引擎是人工智能最大的应用场景。搜狗从2012年开始研发智能语音技术,2013年开始进行深度学习,数据显示搜狗手机输入法日均语音输入超过1.4亿次。搜狗语音输入法和语音搜索最大的场景之一,就是极大增强了微信等移动端的用户体验。
今日头条科学家、头条实验室总监李磊曾是原百度美国深度学习实验室科学家。在2016 CCF-GAIR峰会上,李磊说今日头条对人工智能的投入非常坚决,自2012年创立至今只有4年就专门成立了实验室。今日头条团队很早就有意识在最前沿的技术上做投入,不论是为了当下业务需求还是为了将来的技术储备。对今日头条来说,一边连接内容创作者,另一边连接内容消费者,正需要机器学习技术,今日头条可以说是一家人工智能公司。
腾讯于2012 年成立了优图项目,腾讯优图是腾讯旗下机器学习研发团队之一,专注于图像处理、模式识别、深度学习等,目前已经拥有数十项先进的技术以及数千亿规模的图像计算能力。自创立腾讯优图实验室以来,黄飞跃现为该实验室总监及专家研究员。黄飞跃在2016 CCF-GAIR峰会上表示,期望通过人工智能技术真正改变互联网用户的生活品质,同时也把最新的研发成果通过开发平台和腾讯云对外输出。
猎豹是另一家新进入人工智能领域的公司,在7月份猎豹宣布的二次转型就是希望通过研究深度学习和个性化分发,从安全公司、软件公司发展为一家人工智能公司。尽管猎豹在国际化方面取得了不错的成绩,但随之进入了增长瓶颈以及股价下跌,猎豹今年以5700万美元收购News Republic,希望借助今日头条模式的全球化等打开公司的新业务空间。猎豹CEO傅盛在2016 CCF-GAIR峰会上表示,AI是后互联网时代的新一波红利。
360人工智能研究院成立于2015年9月,该研究院立足于深度学习研发,抓住大数据和云计算的时代机遇,向360相关部门提供业务支持,完成人工智能相关的原始技术积累和前沿探索。在今年3月,AlphaGo人机大战结束后,360董事长兼CEO周鸿祎随即发出员工信,认为人工智能产品在大众消费领域的普及只是一个时间问题。360人工智能研究院院长颜水成在2016 CCF-GAIR峰会上说,人工智能让学术界和工业界有了共同语言。
百度已经在人工智能方面进行了巨资投入,百度无人机项目自从去年在乌镇亮相以来就一直受到业界的关注,百度还计划在五年内实现无人驾驶汽车量产。百度高级副总裁、自动驾驶事业部总经理王劲在2016 CCF-GAIR峰会上介绍,百度去年 12 月购买的激光雷达为70万人民币/台,百度车载大脑也是一台接近 20 万的服务器。为此,百度与激光雷达公司Velodyne LiDAR达成投资意向,在本月Velodyne LiDAR也公开承诺,如果明年拿到一百万订单,64线激光雷达就可以降到五百美金的单价,这将扫平自动驾驶汽车量产的障碍。
另一家互联网公司乐视尽管挖来了原百度深度学习研究院高级科学家、百度无人驾驶汽车团队负责人倪凯负责乐视超级车项目,但倪凯在2016 CCF-GAIR峰会上表示其负责的范围并不仅限于智能汽车。乐视与合作伙伴Faraday and Future成立了一个FF Le Future的实验室,主要是研究人工智能技术,广泛为包括电视、手机、体育、汽车等在内的乐视生态服务。除了美国硅谷的研发中心,乐视也将在北京成立研发中心。
除了IT企业和互联网公司外,民营企业也开始涉及人工智能产业,并视人工智能和机器人为下一个千亿级规模的产业机遇。浙江大华技术股份有限公司是监控产品供应商和解决方案服务商,2014年IHS机构权威报告全球安防视频监控市场占有率位列第二。大华股份从2008年到2015年实现了产值100亿的目标,下一个目标是产值1000亿,为此成立了乐橙云作为视联网品牌,以视频智能硬件、视频云、视频智能技术“三位一体”云开放平台,拉动千亿市场规模。目前,乐橙云选择智能安防和智能母婴两个垂直领域作为首批拓展行业。
窥见未来
(上图为牛津大学计算机系主任Michael Wooldridge)
在2016 CCF-GAIR峰会上,牛津大学计算机系主任、宾夕法尼亚大学工程学院院长、MIT机器人实验室主任等国际学术巨擘向中国产业界传递了最新的研究动向。
牛津大学计算机系主任Michael Wooldridge身兼Oxford-DeepMind Partnership负责人,他认为目前人工智能进展已经解决了棋类问题、SAT等复杂问题以及自动驾驶等,即将解决实时口语理解、骑自行车、可靠的语言翻译等问题,而理解复杂的故事及回答相关问题、创作笑话和有趣的故事、解释一幅图像的意义等则远未达到接近解决的阶段,强AI和通用AI则是完全开放状态。
Michael Wooldridge认为当前谈人工智能奇点还为时尚早,甚至人工智能奇点有可能永远都不会到来!尽管AlphaGo取得了大幅度的学术进展,但AlphaGo仍存在诸多问题。比如AlphaGo程序本身并“不知道”它在玩棋类游戏,它也不能解释自己的策略,也无法从AlphaGo代码中获取这些策略,基本上AlphaGo就是一个黑盒子。因此,AlphaGo无法实现通用型AI。
Michael Wooldridge介绍说他的研究领域为“Multi-Agent System”(多个机器代理系统),这个领域其实也体现了他对AI的观点之一,即在窄任务领域对现有AI服务和算法的整合。当前,产业界逐渐把AI嵌入到几乎所有产品和服务中,但这些AI服务都相对独立和碎片化,那么如何通过单个或多个机器代理系统来整合这些AI服务就成为人工智能的下一个发展目标。比如个人通过手机的机器代理,与其它人的机器代理之间相互协商、相互协调,共同决策一个会议的日程安排以及各嘉宾的时间安排。
Vijay Kumar是美国国家工程院院士、宾夕法尼亚大学工程学院院长,他被认为是空中机器人(无人机)领域开山立派的宗师人物,其学生遍布全球各大无人机厂商。Vijay Kumar表示对空中机器人或无人机的研究,能够为学习和了解机器人的行为特点和算法积累数据。在Vijay Kumar的最新研究中,提出了空中机器人的“蜂群”效应。
所谓“蜂群”效应,就是指一群低智能的机器人聚集在一起,共同完成某项工程或任务。由于功耗等限制,无人机等小型和微型机器人无法配置高级计算资源,因而只能具有较低的机器智能水平。对比自然界的蚁群、鸟群、鱼群等,虽然都是低智能生物,但却能群聚在一起共同完成令人惊叹的复杂工程。对空中机器人“蜂群”效应的研究,还对地面机器人甚至海洋机器人的研究有重要意义。
美国麻省理工学院(MIT)一直是机器人科技研究的先驱,MIT机器人实验室主任、美国国家工程院院士Daniela Rus认为未来世界里,每个人都有可能拥有机器人,机器人就像是在路上跑的汽车一样常见,称之为“泛在机器人”世界。这些“泛在机器人”的形式甚至包括类似大白或自然界中蛇一样的软体机器人,以及水里的机器鱼。而如果误食了鱼刺等异物的时候,还可以吞下微型折叠机器人,从肠道中通过折叠形态把异物包裹起来带出体外。
美国南佛罗里达大学计算机科学与工程学院教授、机器人与深度学习专家孙宇所研究的机械手被认为是非常“黑科技”,是为数不多能与人手相媲美的重大成果。孙宇介绍说,人体206个骨骼,其中1/4的骨骼都在双手里,人体的双手是非常复杂的机械结构,是人体最复杂的器官之一。孙宇表示,机器人智能和计算机智能有所区别,在于机器人要与自然环境实实在在的接触,这是计算机智能没有涉及到的问题,因此机械手的研究有重大意义。
香港科技大学教授杨强的迁移学习无疑是机器学习下一个阶段的重要发展方向,如何能把深度神经元网络和机器学习中训练出的模型提炼出来,并以较小的代价应用到新的领域,这是走向通用AI的重要路径。此外,杨强认为,当前国内的机器学习和人工智能算法研究没有国际上那么均衡,实际上人工智能算法远不止深度神经元网络,而是多元化发展。
当前的大数据可以分为20%的即时性数据和80%的高时延数据。对20%即时性和高重复的数据来说(互联网数据为主),用深度学习算法能解决大部分问题。而对于80%高时延数据来说(例如工业数据)则需要用到强化学习、增强学习、迁移学习等多种人工智能算法,才能解决其数据处理和产生数据智能的问题。
南京大学计算机科学与技术系副主任、机器学习与数据挖掘研究所(LAMDA)所长周志华表示,接下来机器学习技术的一个大趋势是要增加机器学习的鲁棒性。目前很多研究中的机器智能可达到人类水准,但是如果遇到一些罕见的情况,就会错得非常离谱。因此,机器智能在遇到罕见情况的时候,“不能比一般人的处理水平更低”,这是机器学习技术大规模普及的基本前提。
当然,整个人工智能和机器人产业的发展,离不开创业群体。国家教育部长江学者特聘教授王田苗教授表示,未来五年之内,机器人在工业、服务业、智能汽车和无人机等高端产业三大块将可能迎来第一波热潮。由于人工智能技术和认知技术的成熟,未来机器人在银行、家庭、医院、宾馆等服务业的地位将逐渐提高。
紫牛基金合伙人张泉灵特别强调,人工智能创业的商业模式这件事,不是在实验室里就能想出来的。金山软件兼金山云CEO张宏江的观点是,中国人工智能公司的创新能力提升的非常快,与美国等人工智能公司之间的差距正在缩小。一个公司进步的关键不是“看别人”,而应当回归到自身,搞清楚用户到底需要什么,脚踏实地朝这个方向努力。
从新加坡政府一个ADAS项目出来的创业项目Minieye,对标的是Mobileye。Minieye CEO刘国清认为,人工智能时代的产业分工将更加专业化,每一个供应商专注在某一项或几项人工智能技术上并做到极致,智能汽车等整机厂商的角色更像是PC集成商而无法大包大揽所有的技术。
不论巨头们如何进击人工智能,专业化分工将是人工智能生态的游戏规则。(文/宁川,本文首发钛媒体。更多精彩内容 尽在《云科技时代》微信号:CloudTechTime)