1997年,亚马逊发表了著名的“Day 1”致股东信,贝索斯在信中说“ this is Day 1 for the Internet and, if we execute well, for Amazon.com”。
在过去的20年间,亚马逊一直保持在Day 1状态。20年后,贝索斯再次在股东信里强调,“Day 2公司将停滞不前,接着将变得无关紧要,然后将经历痛苦的衰退,直至最终死亡。这就是为何我们总是要做Day 1公司的原因。”
尽管贝索斯所在的办公大楼叫作“Day 1”,但贝索斯很清楚的知道,Day 2终会到来。1997年的时候,亚马逊销售额为1.478亿美金,同比增长838%;而亚马逊在2016年的净销售额达到了1360亿美元,同比增长27%。接下来如何防止走进Day 2?如果不可避免进入Day 2,又如何尽量延长Day 2阶段?贝索斯在2017年度致股东信中大力强调了机器学习与人工智能。
“如果你不能快速拥抱趋势,外部世界就会把你推入Day 2。抵抗趋势,就是抵抗未来……大的趋势不难被发现,但大公司往往难以拥抱它们,机器学习和人工智能就是这样一个明显的趋势。”贝索斯说。
AWS的人工智能全局
在2016年11月底举办的AWS re:invent大会上,AWS正式推出了自己的AI产品线。以此为标志,AWS正式展开了人工智能的全线布局。
亚马逊AWS首席云计算企业顾问张侠介绍了AWS在AI方面的产品框架和四大产品线:AI服务、AI平台、AI框架和AI基础设施。其中AI服务处于最顶层,主要包括了用于图像和人脸分析的 Amazon Rekognition、用于文本转语音的 Amazon Polly 以及用于创建带自动语音识别和自然语音理解(NLU)功能的对话式聊天机器服务 Amazon Lex。AWS提供的这三大系列AI服务,通过已经过预训练而且是高度可扩展的托管AI服务,专门服务于那些想直接使用AI技术与模型的开发人员,并且不需要任何人工智能或深度学习知识就可使用。
在AI平台方面,AWS提供了Amazon Machine Leaning、Amazon Elastic MapReduce(EMR)。其中,Amazon Machine Learning可以让用户使用自己的数据来训练自定义的机器学习模型。Amazon EMR则提供了Hadoop大数据处理能力,以及分布式计算框架Apache Spark和基于Spark的机器学习框架SparkML等。借助这些平台,用户无需担心开发和管理AI训练与模型托管的大数据处理、存储与管理等平台型任务。
在AI 框架方面,Amazon支持所有主要 AI 框架,包括Apache MXNet、TensorFlow、Caffe、Theano、Torch、Keras、CNTK 等,这些开源框架提供了灵活AI编程模型,可以进行大规模的自定义模型训练,适用于那些想要构建复杂智能系统的研究人员和数据科学家等。用户通过预置的AWS Deep Learning AMI机器映像就可以调用这些框架,这些机器映像支持Amazon Linux和Ubuntu系统并进行了预配置。
在最底层则是AI基础设施,比如Apache MXNet等深度学习框架使用的是神经网络模型,就需要底层大规模计算能力的支持。Amazon EC2 P2 实例提供功能强大的NVIDIA GPU,极大缩短了完成AI计算所需时间,Amazon EC2 C4计算优化型实例和M4通用型实例则非常适合使用训练后的AI模型来运行推理。借助无服务器计算编程环境AWS Lambda则可实现无服务器环境下的机器学习,开发者无需关心底层到底使用了哪个数据中心的服务器等大量细节。而 AWS Greengrass则可以在 AWS云和本地设备之间,无缝运行AI IoT应用程序。
虽然AWS是2016年底才推出全线AI服务,但张侠表示:“整个AWS亚马逊云发展非常快,已经有90多项大类服务,2016年就推出了1017个新功能,其中即有新的服务、也有原有服务的新功能,而截至2017年5月1日,我们又推出了322个新服务和功能。因此,对于AWS来说,我们是与自己竞争,通过不断推出新的产品,更好的服务客户需求。”
在全球普及人工智能
对亚马逊AWS来说,推出人工智能的基础设施、框架、平台与服务等全线AI产品与服务,并不是为了与其它公司在人工智能方面一较高下,而是为了在全球范围内普及AI,让AI真正平民化。在这一点上,亚马逊AWS与NVIDIA的黄仁勋有类似的看法,黄仁勋曾说AI最大的价值在于平民化和普及化,只有让每一个国家、企业和个人都有获取和使用AI的能力,才能避免AI的垄断和威胁。
首先,亚马逊AWS的AI基础设施就是AWS云服务,而目前AWS云服务已经全球16个地理区域内运营着43个可用区,并宣布了将增设3个区域(8个可用区)的计划,从而可支持全球190个国家和地区的几乎所有计算工作任务。在2016财年,AWS全年营收高达122亿美元,运营利润为31亿美元,首次超过了100亿美元大关。已经形成良性循环的AWS云服务,成为了AWS AI服务全球普惠的基础。
其次,AWS的开发环境Lamda是一个无服务器架构(serverless),这就意味着开发者在不需要管理基础设施的情况下,可自动运行代码并管理计算资源,并且不会产生不必要的费用。Greengrass让开发者在IoT物联网设备上运行Lambda函数,除了可以在本地执行Lambda函数并保持与云端同步外,Greengrass还支持各种IoT设备间的本地消息传递以及可访问各种AWS服务,这就让AWS AI程序可以大规模运行在云端和边缘设备上。正因为与AWS编程环境Lamda集成在一起,开发者可以轻松使用AWS AI服务开发各种AI应用,为网络应用、即时通信工具或为手机及物联网设备等添加AI能力。
再次,AWS AI服务支持多种编程语言、多种国家语言以及具有很强的可移植性。例如, AWS选择MXNet作为官方机器学习首选平台,是因为它的可编程性、可移植性以及性能等。MXNet支持包括Go、Python、Scala、R语言、Java Script、C++等在内的广泛计算语言,只需要很少量的存储空间即可运行,上千层的神经元网络也只需4G存储空间,可部署在智能手机、物联网设备、无人机等设备上。而文本到语音转换服务Amazon Polly则支持多达24种语言47种声音,覆盖了全球主要国家和地区。
抓住新技术趋势
对于大公司来说,之所有很难拥抱新的技术趋势,是因为新的技术趋势往往与企业现有的业务相冲突。然而,对于亚马逊来说,却不存在这个问题,因为亚马逊天生就是一家新技术公司。
Amazon Rekognition就采用了Amazon Prime Photos所用的技术,可以轻松向应用程序添加图像分析功能,包括对象和场景检测、图像审核、人脸分析、人脸比较、人脸识别、名人识别等。Prime Photos是亚马逊于2012年推出的个人图片存储、备份和分享等功能的图片App,面向Amazon Prime用户提供无限量、为其他用户提供5GB的存储空间。除了存储和分享外,Prime Photos每日分析数十亿张图像,可智能搜索图片,也可为图片做自动分类而无需人为输入任何标签。
借助Rekognition,企业可以定位到图像中的人脸面孔并分析其特征,比如面孔是否在微笑或者眼睛是否睁开着。在分析图像时,Rekognition将返回每个所检测面孔的位置和矩形框架,利用Rekognition的面孔分析功能,就可以跟踪用户的情绪。通过Rekognition分析实时图像,并将情绪特征发送到亚马逊数据仓库Redshift中,就能帮助零售商等定期获得店面的用户趋势等。
而用Rekognition编程也十分简单,因为与Amazon简单存储服务S3和 AWS无服务器编程环境Lambda的无缝集成,可以直接通过 AWS Lambda调用Rekognition API,以响应 Amazon S3事件。由于S3和Lambda可自动扩展和扩容,就可以构建可扩展、低成本且可靠的图像分析应用程序。例如,门上的摄像头会将来访者的照片上传到S3,以触发使用Rekognition API的Lambda 函数,从而识别出访客。该服务还支持 AWS Identity and Access Management (IAM)身份管理,可控制对Rekognition API的安全访问和权限管理。
实际上在亚马逊电商网站的日常运营中,就已经应用了大量的人工智能技术,另一个值得一提的就是Echo智能音箱。Echo是一款可以与用户对话的智能音箱,帮助用户完成各种信息查询(诸如天气、行车路线规划等),执行各种日常任务(如闹钟、音乐等),还能帮助用户在亚马逊电商网站搜索和购买商品。Echo本身并不具备复杂的学习分析能力,它的智能部分是通过互联网连接到云端的Alexa服务完成的,Alexa输出为云服务即为 Amazon Lex。
全美最大的银行之一Capital One就利用Alexa为客户带来全新的智能语音银行体验。Capital One认为,智能语音银行将开启一个全新的客户互动体验。具体来说,Capital One基于Alexa开发并实现了第一阶段的功能:基于智能语音的信用卡账单支付、信用卡余额查询、储蓄账户余额查询、列出近期消费记录、查询信用卡可用额度、查询信用卡账单到期日、账户信息概况/总览等。Capital One 采用了Conference Driven Development的开发模式,通过内部不同团队间的数次会议讨论,促成了该Alexa项目。
Capital One综合了客户常用的各种表述方式开发了新的Alexa Skills Kit,使智能语音银行助手既能对客户提出的意图明显的问题进行快速回答,又能在一些模糊的和泛泛的话题上与客户互动。比如针对近期信用卡的消费记录,Capital One总结了来自不同客户的150多种询问方式,并将其植入Alexa Skills Kit,使得智能语音银行助手可在不同语境下更好的理解客户问题,还会避免比如对余额偏低的客户用玩笑口吻回复的情况。
贝索斯说,能抓住大的趋势,就能乘风而起。亚马逊自己已经抓住一大趋势,成为了全球最大的科技公司之一,AWS亚马逊云也一直蝉联全球云计算市场龙头老大的地位,亚马逊的人工智能产品与服务正向全世界渗透与蔓延。接下来,就需要更多像Capital One这样的金融、零售、制造等企业,利用AWS亚马逊的人工智能技术、产品、平台与服务,进入下一波科技浪潮。只有这样,才能避免Day 2的到来,或为长期Day 2生存,做好准备。(文/宁川)