谷歌开放语音识别 API,对抗 Nuance

  

  谷歌正计划向第三方开发者提供自身的语音识别API与Nuance公司和其他语音识别公司迎面竞争。为了吸引广大开发者,该应用将在日后免费推出。

  我们几乎每周都会听到关于服务发展行业的杂音。谷歌这次的决定是在它的NEXT云计算用户大会上宣布的,此次大会上,它同时也推出了其他学习机的改进和更新计划,最显著的是这次可是一个全新的机器学习平台。

  谷歌的这次的云语音API将覆盖超过80种语言,并且该应用支持实时和批量处理模式,它以“看,听和翻译,”的方式为该应用提供了一整套的API。谷歌说,它与谷歌键盘的语音搜索和语音输入应用相比,它是基于同样的神经网络技术的。当然它还有一些其他有趣的特性,比如在嘈杂的环境中它仍然能够实时工作。

  谷歌的这次举动将会对该行业有很大的影响 - 特别是Nuance,Nuance早就想到了提供业界最好的语音识别能力,并且也是此类服务得最大提供商。许多Nuance的客户,包括创业公司,可以会抛弃Nuance从而选择支持谷歌的技术,因为它不仅给当前用户提供了更佳的体验,同时也是目前成本较低的一个。

  最初为了吸引开发者的兴趣,该API将是完全免费使用。过了一段时间后,该API将可能需要支付一个低成本的定价,这一点我们当然可以理解。谷歌方面可能会选择过一段时间,等它成为同行业的龙头老大后再次提高这些价格。

  谷歌在它产品更新后,已经为它的语音技术提供了有限的访问权限。开发者可以利用JavaScript调用到Chrome的API,例如,之后将其发送到语音识别的API。同时谷歌在2015年宣布了开放一个Google I/O的语音交互API,这使得Android开发者能够将语音交互添加到他们的应用中。但谷歌还没有直接开放它们进入语音识别的API。

  语音API介绍将不仅会影响到Nuance公司和其他语音识别提供商,同时也被看作是对苹果的攻击,因为苹果的虚拟助理Siri所拥有的语音识别功能也是谷歌的对手。Siri也没有为了开发者能够让自己的应用使用Siri技术而提供自己的API。

  谷歌将会更加强调它的语音技术和并且提供许多使用案例。例如,该公司在二月份宣布,它将允许谷歌文档的用户通过语音编辑和格式化他们的文档。

  想了解更多请持续关注,我们将在活动中听到您的想法。

  名片印刷http://www.biyinjishi.com/

时间: 2024-10-21 11:19:38

谷歌开放语音识别 API,对抗 Nuance的相关文章

第三十一节,使用谷歌Object Detection API进行目标检测

Object Detection API是谷歌开放的一个内部使用的物体识别系统.2016年 10月,该系统在COCO识别挑战中名列第一.它支持当前最佳的实物检测模型,能够在单个图像中定位和识别多个对象.该系统不仅用于谷歌于自身的产品和服务,还被推广至整个研究社区. 一.代码位置与内置的模型 1.Object Detection Object Detection模块的位置与slim的位置相近,同在github.com 中TensorFlow 的models\research目录下.类似slim,

百度AI开放平台- API实战调用

百度AI开放平台- API实战调用 一.      前言 首先说一下项目需求. 两个用户,分别上传了两段不同的文字,要计算两段文字相似度有多少,匹配数据库中的符合条件的数据,初步估计列出来会有60-100条左右,不会更多,只会更少.最终的需求是:从这些匹配结果中找到相似度较高的那些条目. 自己编写算法来实现是一个很大的工程,涉及到自然语言处理的一些方面,比较复杂.于是上网搜了搜,发现百度开放平台的自然语言处理可以免费调用,而且每天有10W的调用次数,对我的小项目来说正好满足.但是,在往下翻的时候

新浪微博开放平台API

关于新浪微博开放平台有很多问题,网上文档写的不是很清楚,授权机制把我给难住了 不清楚怎么回事一直报没有权限 EMAIL给开发人员也没回应 偶然尝试到一个方法  States返回了成功 如下代码: 1.在head 引用 <meta property="wb:webmaster" content="8998f19501c5a01c" /> <script src=" http://tjs.sjs.sinajs.cn/open/api/js/w

App开放接口api安全性—Token签名sign的设计与实现

前言 在app开放接口api的设计中,避免不了的就是安全性问题,因为大多数接口涉及到用户的个人信息以及一些敏感的数据,所以对这些 接口需要进行身份的认证,那么这就需要用户提供一些信息,比如用户名密码等,但是为了安全起见让用户暴露的明文密码次数越少越好,我们一般在web项目 中,大多数采用保存的session中,然后在存一份到cookie中,来保持用户的回话有效性.但是在app提供的开放接口中,后端服务器在用户登录后 如何去验证和维护用户的登陆有效性呢,以下是参考项目中设计的解决方案,其原理和大多

百度语音识别API初探

近期想做个东西把大段对话转成文字.用语音输入法太慢,所以想到看有没有现成的API,网上一搜,基本就是百度和讯飞. 这里先看百度的 笔者使用的是Java版本号的 下载地址:http://bos.nj.bpc.baidu.com/v1/audio/Baidu_Voice_RestApi_SampleCode.zip 解压之后里面有个51.2KB的PCM格式的音频文件,笔者尝试用各种播放器发现非常少有能打开的.最后找到一种方法分享一下. 一.播放例子音频 下载安装Adobe Audition 3.0当

第三十四节,目标检测之谷歌Object Detection API源码解析

我们在第三十二节,使用谷歌Object Detection API进行目标检测.训练新的模型(使用VOC 2012数据集)那一节我们介绍了如何使用谷歌Object Detection API进行目标检测,以及如何使用谷歌提供的目标检测模型训练自己的数据.在训练自己的数据集时,主要包括以下几步: 制作自己的数据集,注意这里数据集在进行标注时,需要按照一定的格式.然后调object_detection\dataset_tools下对应的脚本生成tfrecord文件.如下图,如果我们想调用create

谷歌开放实时通信框架WebRTC源代码

北京时间6月2日消息,谷歌今日宣布向开发人员开放WebRTC架构的源代码.WebRTC是一项在浏览器内部进行实时视频和音频通信的技术,是谷歌去年以6820万美元收购Global IT Solutions公司而获得一项技术. 谷歌今日在官方博客中称:“我们希望让浏览器成为实时通信的创新地所在,到目前为止,实时通信需要使用受版权保护的信号处理技术,并通过插件或下载客户端才能实现,而WebRTC则允许开发人员使用HTML和JavaScript API来创建实时应用.” 谷歌还称:“为此我们将与Mozi

各开放平台API接口通用 SDK 前言

最近两年一直在做API接口相关的工作,在平时工作中以及网上看到很多刚接触API接口调用的新人一开始会感到很不适应,包括自己刚开始做API接口调用的相关工作时,也是比较抓狂的,所有写一序列文章把之前的工作做个总结,二来写一个通用SDK把之前涉及到的代码封装成类库,以便以后可以更好地使用.三来对一些有需要的朋友,比如刚接触API接口调用的朋友来说,希望可以给他们提供一些帮助,一起交流,共同成长,一起进步. 今天这篇文章主要是谈一下自己的构想,SDK产品的构思,也希望园内的朋友提出自己宝贵的意见,如果

各开放平台API接口通用SDK序列文章 前言

最近两年一直在做API接口相关的工作,在平时工作中以及网上看到很多刚接触API接口调用的新人一开始会感到很不适应,要看的文档一大堆,自己要调用的接口找不着,或都找着了不知道怎么去调用,记得包括自己刚开始做API接口调用的相关工作时,也是比较抓狂的,也是硬着头皮去看各种文档,熟悉代码,在网上不断地去查找资料.所以决定写一序列文章把之前做的API接口相关的工作做个总结,二来写一个通用SDK把之前涉及到的代码封装成类库,以便以后可以更好地使用.就不用再重创轮子了,三来对一些有需要的朋友,比如刚接触AP