微软语音引擎 TTS 最基本使用

TTS(TextToSpeak)

需求:需要借助程序实现 文字合成语音/语音识别。

TTS 介绍就不说了,这里介绍非常详细 >>> TTS详细介绍  +  SAPI(微软的TTS语音合成和识别接口,可在程序中直接调用)

下面介绍一下,怎么来使用它

1. 下载安装TTS引擎

到微软的官方网站上去下载一下

下载地址>>>微软官方 TTS http://www.microsoft.com/download/en/details.aspx?id=10121

进入下载页面,可以先点击Details 看一下下详细信息,点击Download

下载完成后,安装 SDK51 和 SDK51LangPack 。

2. 可以在程序里用了(使用前先引入一下 sapi.lib 库)

头文件:

1 #include <sapi.h>
2 #include <sphelper.h>
3 #pragma comment(lib, "sapi.lib")//TTS引擎

函数:

 1 //封装SAPI 功能:传入字符串,合成语音并读出。
 2 void Speak(CString str)
 3 {
 4     ISpVoice * pVoice = NULL;
 5     //获取ISpVoice接口:
 6     HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void **)&pVoice);
 7     if(SUCCEEDED(hr)) //如果创建成功
 8     {
 9         pVoice->SetVolume(100);//设置音量
10         pVoice->SetRate(0);//[-10, 10]
11         hr = pVoice->Speak(CStringToBSTR(str), 0, NULL); //读出
12
13         pVoice->Release(); //释放token
14         pVoice = NULL;
15     }
16 }

上面函数是在MFC 中使用 TTS 的实例。使用它可以做很多事,譬如语音播报、语音识别等,值得挖掘很深。

原文地址:https://www.cnblogs.com/yocichen/p/10198304.html

时间: 2024-10-20 20:56:24

微软语音引擎 TTS 最基本使用的相关文章

【VC++技术杂谈004】使用微软TTS语音引擎实现文本朗读

本文主要介绍如何使用微软TTS语音引擎实现文本朗读,以及生成wav格式的声音文件. 1.语音引擎及语音库的安装 TTS(Text-To-Speech)是指文本语音的简称,即通过TTS引擎把文本转化为语音输出. 微软TTS语音引擎提供了Windows Speech SDK开发包供编程者使用.Windows Speech SDK包含语音合成SS引擎和语音识别SR引擎两种,语音合成引擎用于将文字转换成语音输出,语音识别引擎用于识别语音命令. Windows Speech SDK可以在微软的官网上免费下

微软语音技术 Windows 语音编程初步

一.SAPI简介 软件中的语音技术包括两方面的内容,一个是语音识别(speech recognition) 和语音合成(speech synthesis).这两个技术都需要语音引擎的支持.微软推出的应用编程接口API,虽然现在不是业界标准,但是应用比较广泛. SAPI全称 The Microsoft Speech API.相关的SR和SS引擎位于Speech SDK开发包中.这个语音引擎支持多种语言的识别和朗读,包括英文.中文.日文等. SAPI包括以下组件对象(接口): (1)Voice Co

让Java说话-用Java实现语音引擎

让Java说话-用Java实现语音引擎 2005-11-07 10:04:09 分类: Java技术 为应用程序加上语音能力有什么好处呢?粗略地讲,是为了趣味,它适合所有注重趣味的应用,比如游戏.当然,从更严肃的角度来讲,它还涉及到应用的可用性问题.注意,这里我考虑的不仅是可视化界面固有的不足,而且还有这样一些情形:一些时候,让双眼离开当前的工作很不方便,甚至是不合法的.比如,假设有一个带语音功能的浏览器,你就可以在外出散步或开车上班的同时,用听的方式浏览自己喜爱的网站.[@[email pro

ASP.NET Core环境Web Audio API+SingalR+微软语音服务实现web实时语音识别

处于项目需要,我研究了一下web端的语音识别实现.目前市场上语音服务已经非常成熟了,国内的科大讯飞或是国外的微软在这块都可以提供足够优质的服务,对于我们工程应用来说只需要花钱调用接口就行了,难点在于整体web应用的开发.最开始我实现了一个web端录好音然后上传服务端进行语音识别的简单demo,但是这种结构太过简单,对浏览器的负担太重,而且响应慢,交互差:后来经过调研,发现微软的语音服务接口是支持流输入的连续识别的,因此开发重点就在于实现前后端的流式传输.参考这位国外大牛写的博文Continuou

python3调用微软js引擎ChakraCore

有关ChakraCore介绍请移步:https://github.com/Microsoft/ChakraCore 使用案例GitHub源码:https://github.com/pyAppman/ChakraCore 本文主要讲下python调用ChakraCore.dll 参考文献有:https://xz.aliyun.com/t/2450 以及 https://bbs.125.la/forum.php?mod=viewthread&tid=14495171&highlight=Cha

HTML5语音播报引发的:关于TTS引擎扩展及修复注意事项

首先给出HTML5语音播报实例,具体解释请查阅相关文档: //html5语音播报 function speak(textToSpeak) {     //创建一个 SpeechSynthesisUtterance的实例     var utterance = new SpeechSynthesisUtterance();     // 设置文本     utterance.text = textToSpeak;     //增加中文支持     utterance.lang = 'zh-CN';

微软TTS尝试系列之开篇杂谈(仅思路)

第一次写博客,不知道如何下手,思路也乱,就先聊聊怎么进的园子吧,但愿不会浪费大家太多的宝贵时间>_<. 与博客园结缘应该是大三刚开始的时候.当时学校教务处想开发一个教务安排系统,为了省钱就从系里找人,于是我和另外两个同学就接了下来.Money什么的就不说了,接着了解需求.确定方案和分配任务(第一次做一个整体的小项目,比较乱).我们三个从大二开始学习C#,因此开发使用的是C#和ASP.NET.当时对我们来说有两个棘手的问题:一是这个系统需要将录入的内容生成教务处给定格式的Word文档,二是需要根

【Android语音合成TTS】国内主流引擎对比

PS. TTS即TextToSpeech(从文本到语言),也就是语音合成.TTS把文字智能地转化为自然语音流.TTS技术对文本文件进行实时转换,转换时间之短可以秒计算.在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感. 纵观整个应用市场会发现越来越多的APP含有语音识别语音合成的功能,TTS可以帮助开发者轻松构建各类语音交互应用,帮助各行业伙伴打造语音服务特色产品. 下面就给大家分析一下国内的主流语音引擎提供商,希望能对大家开发和

DelphiXE7调用GOOGLE的TTS(文字转语音)

注意:在手机上必须选安装文字转语音引擎“google Text To Speech”地址:http://www.shouji56.com/soft/GoogleWenZiZhuanYuYinYinQingGoogleTexttoSpeech_3864/ 1. 新建一个单元Androidapi.JNI.TTS 1 {*******************************************************} 2 { } 3 { CodeGear Delphi Runtime L