（转）使用Speech SDK 5.1文字转音频

下载地址： http://www.microsoft.com/en-us/download/details.aspx?id=10121

SeppchSDK51.exe 语音合成引擎
SpeechSDK51LangPack.exe 支持日语和简体中文需要这个支持。
SpeechSDK51MSM.exe 如果要将引擎作为产品的一部分发布需要这个。
Sp5TTintXP.exe XP下Mike和Mary语音
sapi.chm 文档

1.安装SpeechSDK51.EXE
2.安装SpeechSDK51LangPack.exe 来支持中文
3.可以在安装文件夹找到一些示例文件，示例文件里可以找到一个生成好的Interop.SpeechLib.dll的文件，当然也可以自己生成这个文件.

简单的代码

1.生成wav文件，其中filename为生成的文件名。

SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync;
SpVoice Voice = new SpVoice();

SpeechStreamFileMode SpFileMode = SpeechStreamFileMode.SSFMCreateForWrite;

SpFileStream SpFileStream = new SpFileStream();
SpFileStream.Open(filename, SpFileMode, false);

Voice.AudioOutputStream = SpFileStream;
Voice.Speak(text, SpFlags);
Voice.WaitUntilDone(Timeout.Infinite);
SpFileStream.Close();

wav文件转换为MP3
这里需要依赖lame的程序[http://www.rarewares.org/mp3-lame-bundle.php]

string outfile = "-b 32 --resample 22.05 -m m "" + fileName + "" "" + fileName.Replace(".wav", ".mp3") + """;
System.Diagnostics.ProcessStartInfo psi = new System.Diagnostics.ProcessStartInfo();
psi.FileName = dir + "lame.exe";
psi.Arguments = outfile;
psi.WindowStyle = System.Diagnostics.ProcessWindowStyle.Minimized;
System.Diagnostics.Process p = System.Diagnostics.Process.Start(psi);
if (waitFlag)
{
p.WaitForExit();
}

时间： 2024-12-21 05:04:50

（转）使用Speech SDK 5.1文字转音频的相关文章

Microsoft Speech SDK开发包使用

下载开发包.我们首先从微软的官网上面下载开发包,下载地址如下: http://www.microsoft.com/en-us/download/details.aspx?id=10121我们主要下载三个关键的程序:SpeechSDK51.exe . msttss22L.exe.SpeechSDK51LangPack.exe,将这三个下载下来即可. 安装sdk.分别将下载的三个安装包解压安装就可以了(记住安装目录). 环境配置.这里我们需要将您安装的Microsoft Speech SDK

智能电话机器人，使用Microsoft语音识别技术（Speech sdk）

最近公司接手到了一个有挑战的项目,很有意思,拿出来和大家分享下,交流下开发过程中的一些收获和感悟. 智能电话机器人原委是这样的,有一个大佬,手里有好多好多,总之就是好多手机充x卡,他想把这些充x卡充值到不同的用户手机号里.有的朋友接触过的,会说“可以和移动去谈,然后搞到移动的接口,根据接口开发程序,然后把充x卡密码都弄进数据库里,用程序读取,之后调用移动接口完成充值.” 说得好,漂亮!而且充x卡密码存到数据库里面这件事,大佬已经找人没日没夜加班干活全都录入到数据库里了. 但是事实很悲催,由于各

智能电话机器人，使用Microsoft语音识别技术（Speech sdk）(下)

接上文现在,硬件上的准备工作做完了. 下一步,先打开Modem的电源,用SecureCRT连接串口,敲入些AT命令,看看Modem能否执行. 这里简单说一下AT命令: AT命令有两种解释一种是调制解调器命令语言,简单来说就是一些固定格式的字符串,我们通过串口向Modem发送AT命令的字符串,Modem就会按照命令去执行不同的操作.AT命令的百度百科请看这里,具体的命令格式和使用方法请自行百度. 我们先来试试拨号向串口发送命令 : atdt10086;\r 不出意外的话Modem就会摘机,并

Microsoft speech sdk 5.1 text to speech

//用于将文字转化成的语音保存成本地的pcm文件 long CPlugin14Ctrl::OnSpeak(LPCTSTR uContents, long uVolume) { // TODO: Add your dispatch handler code here CString cStr=uContents ; //AfxMessageBox(cStr); //COM初始化: CComPtr<ISpVoice> m_cpVoice; HRESULT hr = m_cpVoice.CoCrea

C# ms speech文字转语音例子

最近突发奇想想玩玩文字转语音的东东谷歌了一下发现微软有一个TTS 的SDK 查了查相关资料发现还真不错然后就开始玩玩Microsoft Speech SDK的 DEMO了现在网上最新版好像是Microsoft Speech SDK Version 5.1 先下载下来下载地址是 http://www.52z.com/soft/22068.html 要先安装第一个SDK 然后安装语言包只有安装了语言包语言包是用来支持中文翻读的然后开始我们的C#

Csharp: speech to text, text to speech in win

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86

csharp:Google TTS API text to speech

[转]Microsoft Platform SDK 选择及在vc++6.0中的配置

Windows Platform SDK Download Sites: Windows Server 2003 PSDK February 2003 Edition,可以和VC6一起使用.并支持各种目标OS的最后一个版本的SDK. This edition of the SDK supports development for the following platforms: Windows Server 2003 Windows Advanced Server, Limited Editio

Kinect 开发 —— Kinect for windows SDK

开发 -- 基本的SDK和Windows 编程技巧(彩色图像视频流,深度图像视频流的采集,骨骼跟踪,音频处理,语音识别API) 深度数据,就是Kinect的精髓和灵魂,很多问题都转换为深度图像的模式识别问题 AForge.NET 是一套C#编写的Framework,提供计算机视觉,机器学习 www.aforgenet.com 图像处理需要消耗大量的计算资源,使用C#这类托管语言并不明智,应多使用OpenCV 应用层API详解 NUI API Kinect Audio DMO :提供束波成形和音源

（转） 使用Speech SDK 5.1文字转音频

简单的代码

（转） 使用Speech SDK 5.1文字转音频的相关文章

（转）使用Speech SDK 5.1文字转音频

（转）使用Speech SDK 5.1文字转音频的相关文章