百度强势入场,AI们集体打 call:揭秘百度智能客服背后的语音技术与应用

两年前的今天,AI流行下围棋;今天,AI流行打电话……

这个潮流的最近一次上演,是几天前的百度AI开发者大会上,李彦宏现场播放了百度AI客服邀请开发者的真实电话录音。

当时我就在现场,第一通电话里那位开发者方言比较重,到底说了什么我基本没听懂。但百度的AI却应对自如,在电话中回答了各种问题。

第二通电话更神了,那位女开发者发现了小度的AI身份,直接问百度给ta发钱吗,结果被小度用一句“百度给我免费充电”,巧妙的“回撩”了过去。

在众人的惊叹中,我们很容易发现让AI打电话已经成为了“兵家必争”之地。前不久谷歌I/O大会上Google Assistant演示AI打电话订餐厅,一句“嗯哼”也安排得明明白白。几天之后微软的AI大会上马上反击,不仅上演电话秀,还高调Diss谷歌,表示微软小冰已经打过60多万次电话了。

打电话这件事就这么重要吗?引三大AI巨头都不惜电话费也要硬杠一下?

事实上,在这个AI跟陌生人直接进行有效沟通的场景里,隐藏着两个AI语音与NLP技术的核心关卡,足够给今天AI公司的军备竞赛提供完美肌肉秀。而AI打电话同时也指向另一个问题:AI到底能干什么,是不是在很多领域已经可以完全代替真实的产业劳动?

打个call的功夫,这些复杂的竞争与技术炫技就都显露了出来。

一颦一笑都有来历:为什么已经听不出AI还是真人?

AI打电话第一关:怎么让AI声音听起来不别扭?

我们知道,人和人之间的交流,其实绝大部分依靠的是简单的词汇量+大量复杂的情感词、语气词、助动词。如果我们把日常说话直接转化为文字,会发现文档里80%的话都是“无效信息”。

但怎么让AI学会这些东西,像真人一样有感情、有顿挫,有语气词,甚至有呼吸节奏地与人交流,是一门巨大的技术挑战。

百度AI开发者大会前,百度AI客服给大量开发者打了电话,其中很多开发者一开始压根没有发现这是位AI×××姐。而这其实是建立在它没有刻意修饰机器音的基础上。

如何让AI听起来像人一样,这需要在语音合成与语序修饰上下一番功夫。而这也是各家展现本领的时刻。

根据资料,谷歌I/O大会上的打电话AI,使用了生成式 TTS 引擎。能根据不同的情境控制语音的语调,并生成一些语气词。当然,这背后还有DeepMind的WaveNet自然语音合成算法作为支撑。

虽然谷歌的操作已经十分风骚。但在中文领域想要复制英文的词汇运算以及助词生成却完全无法进行。百度这次展示的语音合成方案,据称是基于中文识别与语义理解技术,创新结合WaveNet加上拼接技术,打造出了满足中文需求,并适合大规模应用的自然语言合成算法。

所以我们在听百度AI客服打电话的时候,会在机器音之外听到自然的语序,合理的语气词使用,甚至模仿出的呼吸声,迈过了AI与人类傻傻分不清楚的第一道门槛。

当然了,只是说话好听是没用的,重点是能听懂,能聊下去。在理解层面,AI的挑战就更大了。

一言一语都是学问:AI如何跟陌生人聊下去

直到今天,很多媒体和看客还在嘲笑AI聊天是“人工智障”。这种声音就像嘲笑最开始跑不过马车的汽车,当有一天大家发现在嘲笑的是什么,已经连汽车尾气都看不见了。

为了能在聊天时不“智障”,无数巧妙到毫厘的技术解决方案正在加紧研发与应用。AI能够真正与人聊天,而不是单纯的一问一答,需要的是AI能够快速识别人类问题,并快速给出回复。这个过程不能卡顿和延迟——没有人想跟慢半拍的机器聊天。

为了解决这个问题,各家高招跌出。比如第五代小冰采用了全双工语音技术,让预测模型和生成模型同步传输数据,达到预测聊天的效果。但可惜的是小冰似乎还没有脱离传统AI对话的窠臼,在流畅度以及“超纲”问题的应答上依旧不够灵敏。

对比谷歌和百度的打电话技术,会发现更好的解决方案,可能是结合自然声音合成技术同步生成高效预测,让AI和真人具有一样的沟通语言习惯。但谷歌的方案一出,马上收到了一些怀疑,比如他们的声音被多家媒体怀疑是录制声音作弊。

另一方面,相较百度的AI客服展示,谷歌语音助手是订餐。换言之谷歌语音助手只用给出信息,并听懂对方的回复就行了。而百度的AI客服却要回答对方可能出现的各种问题。甚至巧妙回答完全超乎一般人机语音对话中的问题——比如“百度给你发工资吗?”

百度的绝招,在于这次强调百度大脑升级的多模态深度语义理解技术,其中语音语义一体化技术,可以有效解决语音识别与语义理解中间的环节迟慢和环节误差问题,达到真正的与人随说所理解。

百度另一个值得注意的核心技术突破,是Deep peak2技术,其识别方案利用音素组合建模,可以忽略上下文影响,极快速准确识别语音语义,在亮相之处就跟华少的语速PK了一把。通过Deep peak2,小度不仅能识别开发者大会上那位老铁让我没听懂的方言,还可以准确识别中英文混合建模。让百度AI的识别错误率,比市面上主流AI语音硬件下降20%,且能应对中英文混着说这个“老大难问题”。

结合知识图谱技术作为基础,新锐语音识别解决方案作为驱动,语音语义一体化技术作为核心,AI客服才能主动与人类聊下去,回答各种问题。可以说在这个技术应用方案上,中国百度已经明显与谷歌、微软拉开差距。

一行一动都是未来:AI客服的大革命

简单来说,打电话这件事的复杂程度和挑战性,让他成为了今天顶尖AI公司必须完成的军备竞赛。

但这项技术的目的当然不仅是为了炫技,用谷歌I/O大会之后美国科技媒体的评价:AI打电话这件事,正在把人工智能技术史无前例地与真实世界联系到一起。

客服投诉、企业管理、调查回访、联系沟通,我们有太多工作是依靠打电话这件事来完成的。假如AI可以胜任这项工作的核心领域,甚至达到以假乱真的地步,那么大量简单重复的语言工作将不再浪费人类的宝贵工作时间。

更重要的是,给陌生人打电话意味着机器与人全方位的沟通。尤其是百度客服电话在AI身份被试穿之后的调侃,完全可以应对大量需要及时处理、协调,给出咨询方案的沟通。甚至可以说,很多人类客服做的不会有它应对的这么好。

这个层面上看,打电话这事可以说是AI现实应用的练兵场。开放的应用层,会带给产业世界无穷的想象。举个例子来说,假如打电话的AI沟通能力,跟精准的机器翻译相结合。那么用AI主动与歪果仁进行跨语种聊天,然后把获取信息反馈回来不就成为了可能?那么市面上那些大张旗鼓的“翻译机”产品,不就失去了基本的存在价值?这就是技术突破后的降维打击。

目前来看,小冰还是无法摆脱语料库的尴尬;而谷歌还需要在更多应用场景证明自己打电话的能力真实性。百度已经领先了一个身位,给中国AI的打call打个call,在今天看来并不过分。

原文地址:http://blog.51cto.com/naojiti/2138920

时间: 2024-07-29 12:35:46

百度强势入场,AI们集体打 call:揭秘百度智能客服背后的语音技术与应用的相关文章

百度AI开放平台 UNIT平台开发在线客服 借助百度的人工智能如何开发一个在线客服系统

这段时间在研究一些人工智能的产品,对比了国内几家做人工智能在线客服的,有些接口是要收费的,有些是免费的,但是做了很多限制,比如每天调用的接口次数限制是100次.后来就找到了百度的AI,大家也知道,目前国内做AI的,应该就算百度比较超前了. 于是就开始研究吧. 百度AI的网址http://ai.baidu.com/    然后就看百度的UNIT的文档    地址参见 https://ai.baidu.com/docs#/UNIT-v2-download/top UNIT机器人对话API文档.里面的

Infortrend亮相2019年台北国际电脑展,横向扩展NAS集群、云存储、AI一体机集体登场

Infortrend普安科技在2019年台北国际电脑展上展示了几条重要的产品线,向与会者显示我们应对数据管理和分析等需求的决心.具备高扩展性的横向扩展NAS,云存储解决方案.智能AI一体机将是我们重点推介的解决方案,这些方案能够帮助企业客户构建灵活的数据环境,在大数据和AI的潮流中持续推动产品与服务的前进. 如今各个行业都在经历数字化转型,数据已成为企业最宝贵的资产. 根据IDC的数据,2019年大数据和数据分析的总产值将达到1891亿美元,预计到2022年将增长到2743亿美元,复合年增长率为

百度网盘,前几天刚从百度云改名过来,百度云这个名字给之前的百度开放云(同步盘用户比较小众)good

作者:黑郁金香链接:http://www.zhihu.com/question/51803053/answer/127562835来源:知乎著作权归作者所有,转载请联系作者获得授权. 在8月网盘大面积关闭的时候我回答过类似的问题目前(2016 年 8 月),市面上哪个云同步盘最好用? - 知乎用户的回答现在还能用的免费大容量网盘:百度网盘(刚从百度云改名过来).微云.天翼云.115等先放观点:对非主营业务的大容量免费网盘我都不看好.理由: 同步盘用户比较小众,并且从几个还存活的网盘关闭同步功能来

纯js客服插件集qq、旺旺、skype、百度hi、msn

原文 纯js客服插件集qq.旺旺.skype.百度hi.msn 客服插件,集qq.旺旺.skype.百度hi.msn 等 即时通讯工具,并可自己添加支持的通讯工具,极简主义,用法自己琢磨.我的博客 http://www.qiling.org <script> //在线客服插件 powered by casejs 极简主义 http://www.mlrzw.cn function CaseService(caseServiceConfig) { this.config = caseService

qq客服、百度分享、视频播放

1.点击qq客服,出现qq聊天页面http://shang.qq.com/v3/index.html点击推广 2.百度分享http://share.baidu.com/code/advance <div class="bdsharebuttonbox" data-tag="my_share" id="newsShare"> <span class="fl">分享到:</span><a

我为什么卸载了百度手机助手(我们应不应该抵制百度的这种不要脸的推广行为)

我一直在用百度手机助手,以前还叫商店的时候就在用,今天我发现它开始不要脸了,为了利益脸不要了. 今天早上出门前我看它提示有更新,我就让他更新了.到公司我发现手机桌面多了一个图标,是百度(手机百度客户端,图标像个熊掌的那个),我没搭理它直接删了. 中午我发现那个图标又出现在我的桌面上,我点击了一下,是让我安装手机百度,我点击了取消(我根本不需要这个东西嘛),之后又把那个图标删除了. 就在刚刚,我看了一眼手机桌面,那个图标再一次出现了,我受不了了,这是赤裸裸的不要脸啊,诚心恶心我么,我就把百度手机助

百度内部邮件曝光:李彦宏称百度国际化崭露头角

导语:李彦宏称,在移动端,百度的产品已经开始服务于印尼.巴西.泰国.印度.美国和菲律宾的广大用户. 亲爱的百度同学们: 此刻,我身在巴西.世界杯刚刚落幕,这个南美洲最大的国家热情仍未消退.几个小时前,百度又在这里经历了一个历史性时刻:当地时间的中午12点15分,习近平主席与巴西总统迪尔玛·罗塞夫一起按动电脑键盘,正式启动百度巴西葡语版搜索引擎,在两国元首见证下,我在电脑中输入首个葡语搜索关键词"Brasil China"我们的葡语搜索结果向世界亮相.由两国最高元首共同启动百度产品的上线

90网论坛专业快速 揭秘百度快速排名的七大谎言

对于倏地排名网上有许多相干材料,然而假如你依照网上的那些说法去操纵的话你会发明貌似都不后果!是的,要否认一点:能研收回倏地排名的人不会把中心技巧颁布出来.网上的那些对于倏地排名的材料只不外是那些没用实战过的人的预测罢了,真正的倏地排名技巧绝非互联网上的那些材料说的那样,明天就来揭露下百度倏地排名的七大假话! 百度倏地排名 一.咱们的是百度外部资本不是点击 当初市道上全部的倏地排名技巧都是点击道理,说是百度外部资本的只是想让你释怀罢了.试想一个词几百块钱百度员工会冒危险给你开后门? 二.要依据排名

百度地图距离计算,计算结果和调用百度的api一样

 var DEF_PI =Math.PI;// 3.14159265359 var DEF_2PI =2 *Math.PI;// 6.28318530712 var DEF_PI180 =Math.PI/ 180.0;// 0.01745329252 var DEF_R =6370996.81;// radius of earth // 利用弧夹角方式计算地图上两点之间的距离,和百度地图计算结果不一致 function GetShortDistance(lon1, lat1, lon2, l