讯飞阅读与声音复刻:让语音黑科技留住你的声音

提要:在人工智能和移动互联网飞速发展的今天,产品语音同质化越来越严重,如何凸显出产品中的语音特色、让产品的语音有温度变得尤为重要。为此,科大讯飞旗下产品讯飞阅读推出了声音复刻功能,此项功能可基于深度学习的人工智能合成技术为个人定制个性化音库。

  在人工智能和移动互联网飞速发展的今天,产品语音同质化越来越严重,如何凸显出产品中的语音特色、让产品的语音有温度变得尤为重要。为此,科大讯飞旗下产品讯飞阅读推出了声音复刻功能,此项功能可基于深度学习的人工智能合成技术为个人定制个性化音库。

  讯飞阅读的声音复刻功能依托于科大讯飞全球领先的智能语音合成与个性化技术,用户只需通过简单的语音录入样本,即可获得完整音库,从而将任意文字转化成自己的声音,最终运用到听书阅读等领域。

  讯飞阅读声音复刻功能的第一个测试版本发布于2017年11月,是全球首款面向广泛用户的个性化语音合成应用,是将神秘语音合成技术真正“平民化”的个人音库定制产品。无独有偶,微软于2018年5月上线了Custom Voice语音合成定制平台,旨在实现语音定制技术的平民化。在智能语音的源头创新方面,讯飞和微软、谷歌等科技巨头看似英雄所见略同,但实际上讯飞的前瞻性和成绩单更为瞩目:讯飞阅读的声音复刻功能只需要10句的声音采集,即可完成个人声音的复刻,采集量只有行业平均的百分之一(远低于微软的500句与行业的千句)。

  讯飞阅读也是长期技术沉淀后的产品,因为科大讯飞20年来专注深耕于智能语音技术,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。在与国际巨头同台竞技中,科大讯飞连续十三年蝉联国际语音合成大赛(Blizzard Challenge )冠军,被《MIT科技评论》评选为“全球最聪明50家公司”之一。科大讯飞在与企业和媒体的合作过程中,打造出不胜枚举的典型案例,其中,大众比较熟知的有导航类APP中大量明星播报的定制音库、《创新中国》中“复活”李易老师声音的定制音库、运用在央视及其他广电领域的虚拟主持人解决方案等。这使得科大讯飞对音库定制和音库应用技术驾轻就熟,将工业级解决方案普世化,实现个人音库自助定制的功能也就水到渠成。

  利用讯飞阅读声音复刻功能打造的个人专属音库未来可使用在车载导航、游戏娱乐、智能家居、早教玩具等与生活息息相关的领域。可以想象在不远的将来,智能音箱中女朋友的声音每天准时叫你起床,为你播报天气,提醒你添衣带伞;车载导航系统里,你妻子、孩子的声音为你保驾护航,提示你安全驾驶,早些回家;又或者,你将自己的声音预置到智能玩具中,让它替你给孩子讲故事,伴孩子入眠;即使你远在外地,依旧能够陪伴家人!

  科大讯飞的企业愿景是用人工智能建设美好世界,而人工智能的最终要义正是满足个体差异化需求,提供个性化服务,为个体的自我实现提供坚实基础。

  讯飞阅读声音复刻功能现已限量开放,随着优质个性化声音应用的软硬件加入,全球个性化音库生态也会逐渐成型。著名波谱艺术领袖安迪·沃霍尔曾说过,“每个人都能出名15分钟”,而讯飞阅读可以复刻美好声音,让你的声音成为你的品牌资产,让那些值得被铭刻的美好时光常伴长存!

原文地址:http://blog.51cto.com/13934481/2287574

时间: 2024-10-08 11:59:42

讯飞阅读与声音复刻:让语音黑科技留住你的声音的相关文章

破局与进阶,科大讯飞的新武器“讯飞阅读”

深耕技术,沉淀场景,迭代产品,科大讯飞逐步展现着破局与进阶的AI魄力. "讯飞阅读"--一个能快速.便捷.完美复刻你声音的平台,是有声小说阅读神器,科大讯飞的新武器. 如果说2015年是人工智能的概念年,2016年是其蛰伏期,那么2017和2018必然是人工智能的落地元年. 近日,科大讯飞的半年报逐渐被披露,企业上半年营收32.1亿,同比增长了52.68%,毛利16.02亿,同比增长了56.02%. 稳中有升的毛利率中,这家人工智能的龙头企业逐步展现着自己极强的竞争力. 深耕技术,沉淀

左手内容右手科技,讯飞阅读打造适合年轻人的有声阅读APP

2018中国有声书市场专题研究报告显示:2016年到2018年,有声书市场规模年均复合增长率34.8%,其市场规模从2016年的23.7亿元增至2018年的45.4亿元,预计到2020年将会超过78亿元.随着市场的逐渐成熟,以及用户对内容付费的接受程度不断提高,未来有声阅读付费空间潜力巨大,堪称一座待挖掘的金矿. 如今人工智能AI技术已经随着移动通信技术.云计算.神经网络.物联网技术的发展而迎来了第三次浪潮.具体到数字阅读领域,人工智能为数字阅读提供了创新的解决方案.在利用人工智能进行新的阅读方

讯飞的实时转写可以带来哪些功能?

讯飞开放平台最近上线了实时语音转写功能:www.xfyun.cn/services/rt-?基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与语言转写核心引擎的长连接,将音频流数据实时转换成文字流数据结果,基本可以做到所听即所见.那么,该功能会为开发者解决什么问题,带来什么变化呢?1.针对客服助手的改造:可以减少客服录入工单的时间,结合自己的场景自动化生成文档记录:2.针对外呼助手的改造:外呼信息.客户信息自动记录,避免因走神遗漏信息:3.智能会议成为现实:会议内容说什么

讯飞移动广告平台开启移动广告交互新模式

据CNNIC<2014年第34次中国互联网络发展状况统计报告>显示,目前我国手机网民数量已超过5.27亿,超过PC端和笔记本的总和,成为网民上网使用量最大的终端.毫无疑问,属于移动互联网的时代已经到来. 伴随着移动互联网的井喷式发展,移动营销对企业的重要性日渐凸显.2013年中国移动营销市场规模155.2亿元,同比增长105.0%.企业投入的增加,也催生了大量从事移动营销的广告代理公司.广告投放平台和提供广告流量的APP开发者.目前,移动互联网主流的广告投放模式是:广告投放平台通过技术手段,将

ThinkPad 复刻计划 ThinkPad Time Machine

在快节奏的高科技市场中,针对性的进化 ThinkPad 的设计几乎是闻所未闻的.在汽车行业,保时捷无疑干的不错,但我不认为有任何其他的电脑公司可以顶住压力,坚持自己的初心这么久.没有任何一个竞争对手可以宣称其拥有比 ThinkPad 更深厚的历史底蕴或血统.还记得1999年半透明电脑的热潮吗?我仍然试图忘记它.直到今天,你都可以买到一台与 Richard Sapper 在1992年构思的,最原始的概念拥有明确的联系的 ThinkPad, 这个简单的黑色盒子这么多年来干的都很不错. 从1992年的

android用讯飞实现TTS语音合成 实现中文版

Android系统从1.6版本开始就支持TTS(Text-To-Speech),即语音合成.但是android系统默认的TTS引擎:Pic TTS不支持中文.所以我们得安装自己的TTS引擎和语音包. 在项目中,一开始用的是手说TTS,免费版的,感觉声音很不僵硬,不自然,不连贯.付费版的还要钱激活,如果不激活,限制每次只能度5个字,而且比免费版也好不了多少.最后采用了讯飞语音TTS1.0,发音连贯自然,个人感觉很不错了,以后就用它. 介绍下使用方法: 1.首先下载讯飞的语音包apk,以及语音引擎a

cocos2dx实现android的对讯飞语音的合成(语言朗读的实现)

事实上非常easy,只是有些细节须要注意. 关于讯飞语音在android上的应用,大家须要自己去下载SDK,然后依照讯飞语音提供的api在自己的android的Demo上执行成功,那东西也相当的简单. 然后,大家也须要把自己的cocos2dx项目在android 上部署起来,这些网上资料非常多,也不一一解释,兴许我也会做出相应的总结.这里不多说. OK,废话不多说,直接上代码 思路就是,通过cocos2dx的JNIhelper类实现C++对Java的调用,然后实现语音功能 废话不多说: 直接上代

聚焦语音交互,引爆智能硬件——暨讯飞语音云沙龙杭州站成功举办

5月16日,"让世界聆听我们的声音"--2014年语音云开发者沙龙暨"聚焦语音交互引爆智能硬件"在杭州贝塔咖啡成功举办. 自2013年8月以来,由讯飞语音云举办的开发者沙龙已走过北京.上海.深圳.成都.合肥.厦门等地,与1000多名开发者亲密接触,爆棚的场面.忘我的分享和激烈的讨论,让我们更加坚信:移动互联网时代,语音交互将无处不在. 2014年被称为智能硬件元年,在2014全球移动互联网大会上,智能硬件成为主角, "下一个50亿"预示着智能硬件

php调用讯飞语音合成

开发背景:需要机器阅读文档,看了bat和讯飞的,领导决定用讯飞的,其实bat的也非常好废话又多了,直接看代码吧 header("Content-type: text/html; charset=utf-8"); $url = 'http://api.xfyun.cn/v1/service/v1/tts'; $appid = 'xxxxx'; $appkey = 'xxxxxxx'; $data = array( 'auf' => 'audio/L16;rate=16000', '