Amazon Alexa 语音识别1 : 简介

Alexa是Amazon自家的语音识别技术,需要配合自家的Echo音箱使用。开发者可以在Amazon上建立自己的程序(Skill)来连接到自己的应用或是硬件。例如,用户家里有一套xx牌的智能灯,现在希望通过语音来控制。首先,用户对Echo音箱说出唤醒词(默认是Alexa,也可以设置为Echo),随后说出命令,如Ask xx to turn on the lights,xx是应用的关键词。随后,amazon在识别出用户的意图之后,会发起一个post请求到开发者的服务器上,开发者服务器对此请求作出回应并控制对应的灯泡。以上就是一个典型的请求和响应的流程。

识别的过程也是比较清楚的,首先Echo讲语音数据发送给Alexa识别,Alexa识别后会转化成开发者自定义的intent(不是文字,原始文字是拿不到的)和slots(如果有的话),将其post到开发者服务器上。开发者服务器对intent和slots进行分析,对不同的请求作出相应的动作和相应。这个过程中存在几个映射,1是语音到文字的映射,这是由Alexa完成的,开发者无法控制。2是文字到intent的映射,这个定义在Sample utterance files内,用户可以自行修改;这个映射通常是多对一,即多个文字可能对应相同的intent。第三个是intent到实际动作的映射,应用的intent数量和名字都定义在后台的intent schema内。至于每个intent要如何处理,是开发者自行在服务器上设定的。

时间: 2024-10-15 14:57:18

Amazon Alexa 语音识别1 : 简介的相关文章

Amazon Alexa登录授权(Android)

访问Alexa的API,必须要携带AccessToken,也就是必须要登录授权,本文主要记录Amazon Alexa在Android平台上的登录授权过程. 一.在亚马逊开发者平台注册应用 进入亚马逊开发者平台的Alexa栏 https://developer.amazon.com/edw/home.html#/ 点击Alexa Voice Service的Get Started,进入到应用管理页面 选择注册一个产品,我这边选的是application,然后开始填写相关信息. 这里Applicat

机智云在Amazon Alexa平台发布Smarthome和Custom Skill

机智云在Amazon Alexa平台率先发布了Smarthome Skill和Custom Skill,实现了亚马逊Echo直接控制机智云开源套件Gokit(包括Gokit2.0和Gokit3.0)!这也将意味着:随着机智云和亚马逊账号的打通,接入机智云的产品都可以轻松实现Amazon Echo控制功能.(下附实战篇) Amazon Echo是时下风靡全球的一款结合了Amazon人工智能助理 Alexa 的音箱,支持Wi-Fi连接,依靠语音命令进行激活,让用户以最自然的语音交互方式,连接到 Am

语音识别技术简介

在人际交往中,言语是最自然并且最直接的方式之一.随着技术的进步,越来越多的人们也期望计算机能够具备与人进行言语沟通的能力,因此,语音识别这一技术也越来越受到关注.尤其,随着深度学习技术应用在语音识别技术中,使得语音识别的性能得到了显著提升,也使得语音识别技术的普及成为了现实. 以上是废话,下面开始正文. 自动语音识别技术,简单来说其实就是利用计算机将语音信号自动转换为文本的一项技术.这项技术同时也是机器理解人类言语的第一个也是很重要的一个过程. 为了进一步解释计算机如何实现语音到文字的转换这一过

Amazon Alexa进阶到播报员 以播报员的讲话风格念新闻

Amazon智能音响搭载的语音助理Alexa现在可以像新闻播报员念新闻给用户听了,Amazon认为,Alexa的回复和声音是与用户自然互动的关键,语音助理的语音输出是透过文字转语音的技术,将单词序列转换为仿真人的声音,系统会选择字符串组成双音素(diphones),用更自然的方式讲出词汇.词组或是句子,自2014年推出Alexa后,Amazon就不断地优化机器学习模型,来确保模型能够选择正确的双音素,让语音听起来更加自然.去年11月,Amazon曾揭露最新的文字转语音系统研究,透过生成神经网络,

继Amazon Alexa机智云成功对接Google Home语音控制

(内附通过gokit 玩转Google Home语音控制开发技能说明文档) "智能音箱作为智能家居入口和家庭人工智能交互的切入点,不仅吸引了世界第二大电商AWS的布局,同时也吸引了坐拥数十亿活跃用户的多款产品线的Google布局,尽管AWS Echo已出货1000万台,但是Google运用十年沉淀的技术和生态布局Google Home,蓄势待发,究竟谁会是坐上智能音箱的宝座,有待时间验证" 目前,机智云作为全球最大的物联网开发(PaaS)及(SaaS)云服务平台,已完成Google H

2019年,这8款自动语音识别方案你应该了解!

2019年,这8款自动语音识别方案你应该了解! 原创: AI前线小组 译 AI前线 1周前 作者 | Derrick Mwiti翻译 | 核子可乐编辑 | LindaAI 前线导读: 基于计算机的人类语音识别与处理能力,被统称为语音识别.目前,这项技术被广泛用于验证系统中的某些用户,以及面向谷歌智能助手.Siri 或者 Cortana 等智能设备下达指令. 从本质上讲,我们通过存储人声与训练自动语音识别系统以发现语音当中的词汇与表达模式.在本文中,我们将一同了解几篇旨在利用机器学习与深度学习技术

AWS研究人员找到改善Alexa语音和声音辨识

AWS发表改善Alexa语音和声音辨识的两篇论文,皆是透过机器学习技术,来处理Alexa语音识别的问题.AWS第一个介绍的方法,是针对Alexa接收到来自电子媒体的干扰问题,像是电视或是收音机的声音,AWS团队开发出一套能够更好地辨识媒体音频的方法,且能够长时间持续检查音频,帮助Alexa过滤掉非用户语音的背景声音讯号.另一个方法则是利用外部数据集,透过半监督式学习法,来训练出语音事件侦测模型,半监督式学习法是采用小型已标注的训练数据集,来对照到大型未标注的数据集,尤其是,AWS团队是用Tri-

Gartner:2018人工智能技术成熟度曲线

https://www.secrss.com/articles/4392 人工智能被广为关注,但是一些想法恐难达到预期.本成熟度曲线将追踪AI基本趋势和未来创新,以确定人工智能技术发展的范围.状态.价值和风险. 一.从曲线上消失的技术 2018年,以下几个技术已经从曲线上消失: ? 1.虚拟客户助理 ? 2.认知专家顾问 ? 3.3级和4级自动驾驶 ? 4.深层强化学习 ? 5.智能应用程序 ? 6.信息技术操作人工智能平台 二.2018曲线五个阶段的关键技术 (一)上升阶段 1  人工智能管理

自然语言处理哪家强?

自然语言处理哪家强? 摘要:语音交互事关未来,这点从大公司收购.投资.合作不断,就可见一斑.如苹果收购Siri.Novauris.Google收购多项语音识别技术专利.Facebook收购Wit.ai等.Amazon收购Yap--目前,基本上所有的巨头都有涉足. 语音交互事关未来,国内外已经不少公司在抢蛋糕了,大公司收购.投资.合作不断,就可见一斑.目前,基本上所有的巨头都有涉足. 苹果收购Siri.Novauris,组建基于神经网络算法的语音识别团队 2014 年7月,有消息称,苹果正在联系多