如何让语音交互更流畅?

在体验过几款云后视镜和目前在实现‘eagle‘过程中,各家都使用第三方语音识别技术的情况下,如何让语音交互过程更流畅、智能?初步思考出两种体验优化方法,请大家斧正!

一、自定义语义词汇完善(难度:**)

1. 用户与车载硬件,通过语音交互,目前阶段更多的是指令的下发与执行。对指令的执行无非两种情况“是或不是”。但由于不同方言或文化背景,导致能够表达出“是或不是”的词汇非常多,为了让车载APK更智能,可在后台建立更为完整的‘肯定词汇组’与‘否定词汇组’,这些词汇组通过人工的方式收集、整理,并下发给车载APK本地缓存。车载APK在进行语音交互的时候,对于未理解的指令(即云端不支持),可以到本地词汇组中匹配,并做出判断。这种方式,可以大大加强语音交互过程中,指令执行的准确率。

2. 举例:

用户:导航到华强北                                                                               (传达指令)

机器:您是要导航到华强北吗?                                                              (指令重复、确认)

用户:对的|是啊|OK|是的|是|呵呵|嗯|......                                                 (这类词汇表示:是、肯定)

用户:错|不对|No|不是的|你傻啊|......                                                         (这类词汇表示:不是、否定)

二、人工智能学习(难度:*****)

1. 实际使用语音交互功能的时候,绝多数用户第一次是不会按照‘使用帮助’要求去下发指令,而是按照自己的说话习惯下发指令,这就导致机器(第三方语音识别SDK)无法根据语义作出正确判断。举例:用户说:去华强北怎么走/导航/地图,这些说语义代表的是‘导航到***’

2. 解决思路

① 车载APK将当前未能正确识别的语义内容,上传到后台(带有车载硬件IMEI);

② 后台将这些语义进行人工分析、归类,如:去华强北怎么走,被归类到‘导航’这个语域

③ 车载APK主动下载属于自己的语义库(实现自我学习机制)

3. 优化

① 后台将收集到的无法解析的语义,通过人工进行分析、归类

② 后台主动调用第三方语音识别SDK,如科大讯飞、百度、腾讯等等,由它们的语音识别SDK来辅助解析,自动实现分析、归类

时间: 2024-10-08 04:25:22

如何让语音交互更流畅?的相关文章

如何使页面交互更流畅

流畅性 本篇是基于 FDCon2019 上<让你的网页更丝滑by刘博文>的复盘文.该课题也是博主感兴趣的领域, 后续会结合 React 的 Schedule 与该文进行进一步整合, 个人博客 被动交互: animation 主动交互: 鼠标.键盘 被动交互 当前市面上的设备频率在 60 HZ 以上. 主动交互 跑如下界面 https://code.h5jun.com/pojob 结合如下代码块, 可以看到 100ms 以下的点击是顺畅的, 而超过 100ms 的点击就会有卡顿现象. var o

几个常见的语音交互平台的简介和比较

1.概述 最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,或者更确切的说是关键字识别,但开发的平台不同, 一个是windows下的,另一个是android平台的,于是也就选用了不同的语音识别平台,前者选的是微软的Speech API开发的,后者则选用 的是CMU的pocketsphinx,本文主要将一些常见的语音交互平台进行简单的介绍和对比. 这里所说的语音交互包含语音识别(Speech Recognition,SR,也称为自动语音识别,Automatic Speech R

聚焦语音交互,引爆智能硬件——暨讯飞语音云沙龙杭州站成功举办

5月16日,"让世界聆听我们的声音"--2014年语音云开发者沙龙暨"聚焦语音交互引爆智能硬件"在杭州贝塔咖啡成功举办. 自2013年8月以来,由讯飞语音云举办的开发者沙龙已走过北京.上海.深圳.成都.合肥.厦门等地,与1000多名开发者亲密接触,爆棚的场面.忘我的分享和激烈的讨论,让我们更加坚信:移动互联网时代,语音交互将无处不在. 2014年被称为智能硬件元年,在2014全球移动互联网大会上,智能硬件成为主角, "下一个50亿"预示着智能硬件

SLAM+语音机器人DIY系列:(七)语音交互与自然语言处理——2.机器人语音交互实现

摘要 这一章将进入机器人语音交互的学习,让机器人能跟人进行语音对话交流.这是一件很酷的事情,本章将涉及到语音识别.语音合成.自然语言处理方面的知识.本章内容: 1.语音交互相关技术 2.机器人语音交互实现 3.自然语言处理云计算引擎 2.机器人语音交互实现 其实要自己做一款语音对话机器人还是很容易的,我们只需要选择好语音识别.语音合成.自然语言处理的技术,就可以在一款树莓派3开发板上实现了.由于语音交互系统的核心技术是云端自然语言处理技术,所以我们可以选择网上免费提供的语音识别.语音合成等现有方

秒开缓存系统让网速更快更流畅

互联网发展势头日趋迅猛,一些高清视频.精美图片以及网页的加载内容日趋丰富,使得运行流量无限增长,由于对出口产生压力,导致用户体验越来越差.这要是放在从前,你要是着急就只有增加带宽,这是要继续增加投入的,看来这不是长远打算.武汉秒开网络科技有限公司研发的秒开缓存系统的出现,彻底解决了这些难题. 说了这么多,也许你还没有了解秒开缓存系统是个什么东东,举个例子来说吧.你入住一家还算有规模的酒店,想要看个电影解解乏,可是看着看着画面就停在那里了,一个圈圈在那儿转啊转的就是看不了.这说明了什么,是因为这家

[ jquery 效果 slideDown([speed,[easing],[fn]]) slideUp([speed,[easing],[fn]]) ] 此方法用于滑动显示隐藏的被选元素:动画效果只调整元素的高度,可以使匹配的元素以“滑动”的方式显示出来。在jQuery 1.3中,上下的padding和margin也会被有动画,效果更流畅

此方法用于滑动显示隐藏的被选元素:动画效果只调整元素的高度,可以使匹配的元素以“滑动”的方式显示出来.在jQuery 1.3中,上下的padding和margin也会被有动画,效果更流畅 实例: <!DOCTYPE html><html lang='zh-cn'> <head> <title>Insert you title</title> <meta http-equiv='description' content='this is my

谷歌推出全新Android开发语言Sky:让App更流畅

土豆网同步更新:http://www.tudou.com/plcover/VHNh6ZopQ4E/ 使用HTML 创建Mac OS App 视频教程. 官方QQ群: (1)App实践出真知 434558944 (2)App学习交流 452180823 百度网盘同步:http://pan.baidu.com/s/1jG1Q58M 分享  [中文纪录片]互联网时代                 http://pan.baidu.com/s/1qWkJfcS 谷歌推出全新Android开发语言Sky

保养硬盘的技巧,让电脑读写更流畅!

有时候我们会遇到电脑读取不到硬盘无法开机.电脑复制粘贴文件较慢或者是蓝屏的情况,其实这些都可能与我们平时对硬盘保养不当,造成硬盘出现坏掉等损伤有关.今天就与大家分享几个保养电脑硬盘的小技巧,让你的电脑读写更流畅~ 我们在使用硬盘时应注意以下几点: 这样保养硬盘,让你的电脑读写更流畅! 一.硬盘高速运转时不要突然关机 硬盘高速运转时如果我们中途突然关闭电源,可能会导致磁头与盘片猛烈磨擦而损坏硬盘,因此要避免突然关机.怎么判定硬盘是不是在运转可以看面板硬盘指示灯只有在其指示灯停止闪烁.硬盘读写结束后

IPTV电视直播系统apk运营—怎么让视频更流畅

很多IPTV电视直播系统运营者都会有这样的疑问:怎么才能让视频更流畅的播放? 这里小编就可能影响APK播放视频流畅度的原因做简单分析. 视频源的清晰度和流畅度 我们知道视频的 清晰度和大小和视频的码率有关,如果运营者自己的源本身就是码率高的,而且在VLC等常用播放器中都可以流畅播放的话,那么在电视盒中如果其他条件都是比较好的话,那么就可以实现清晰流畅播放. 播放器性能 很多IPTV电视直播系统的APK软件商的播放器是自己研发的,但是也不排除有些是用的开源的系统,相比开源系统播放器,自主研发的会在