(转) 使用Speech SDK 5.1文字转音频

下载地址: http://www.microsoft.com/en-us/download/details.aspx?id=10121

SeppchSDK51.exe 语音合成引擎
SpeechSDK51LangPack.exe 支持日语和简体中文需要这个支持。
SpeechSDK51MSM.exe 如果要将引擎作为产品的一部分发布需要这个。
Sp5TTintXP.exe XP下Mike和Mary语音
sapi.chm 文档

1.安装SpeechSDK51.EXE
2.安装SpeechSDK51LangPack.exe 来支持中文
3.可以在安装文件夹找到一些示例文件,示例文件里可以找到一个生成好的Interop.SpeechLib.dll的文件,当然也可以自己生成这个文件.

简单的代码

1.生成wav文件,其中filename为生成的文件名。

SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync;
SpVoice Voice = new SpVoice();

SpeechStreamFileMode SpFileMode = SpeechStreamFileMode.SSFMCreateForWrite;

SpFileStream SpFileStream = new SpFileStream();
SpFileStream.Open(filename, SpFileMode, false);

Voice.AudioOutputStream = SpFileStream;
Voice.Speak(text, SpFlags);
Voice.WaitUntilDone(Timeout.Infinite);
SpFileStream.Close(); 
    1. wav文件转换为MP3
      这里需要依赖lame的程序[http://www.rarewares.org/mp3-lame-bundle.php]

      string outfile = "-b 32 --resample 22.05 -m m "" + fileName + "" "" + fileName.Replace(".wav", ".mp3") + """;
      System.Diagnostics.ProcessStartInfo psi = new System.Diagnostics.ProcessStartInfo();
      psi.FileName = dir + "lame.exe";
      psi.Arguments = outfile;
      psi.WindowStyle = System.Diagnostics.ProcessWindowStyle.Minimized;
      System.Diagnostics.Process p = System.Diagnostics.Process.Start(psi);
      if (waitFlag)
      {
      p.WaitForExit();
      }

时间: 2024-12-21 05:04:50

(转) 使用Speech SDK 5.1文字转音频的相关文章

Microsoft Speech SDK开发包 使用

下载开发包.我们首先从微软的官网上面下载开发包,下载地址如下: http://www.microsoft.com/en-us/download/details.aspx?id=10121我们主要下载三个关键的程序:SpeechSDK51.exe . msttss22L.exe.SpeechSDK51LangPack.exe,将这三个下载下来即可.   安装sdk.分别将下载的三个安装包解压安装就可以了(记住安装目录).   环境配置.这里我们需要将您安装的Microsoft Speech SDK

智能电话机器人,使用Microsoft语音识别技术(Speech sdk)

最近公司接手到了一个有挑战的项目,很有意思,拿出来和大家分享下,交流下开发过程中的一些收获和感悟. 智能电话机器人 原委是这样的,有一个大佬,手里有好多好多,总之就是好多手机充x卡,他想把这些充x卡充值到不同的用户手机号里.有的朋友接触过的,会说“可以和移动去谈,然后搞到移动的接口,根据接口开发程序,然后把充x卡密码都弄进数据库里,用程序读取,之后调用移动接口完成充值.” 说得好,漂亮!而且充x卡密码存到数据库里面这件事,大佬已经找人没日没夜加班干活全都录入到数据库里了. 但是事实很悲催,由于各

智能电话机器人,使用Microsoft语音识别技术(Speech sdk)(下)

接上文 现在,硬件上的准备工作做完了. 下一步,先打开Modem的电源,用SecureCRT连接串口,敲入些AT命令,看看Modem能否执行. 这里简单说一下AT命令: AT命令有两种解释一种是调制解调器命令语言,简单来说就是一些固定格式的字符串,我们通过串口向Modem发送AT命令的字符串,Modem就会按照 命令去执行不同的操作.AT命令的百度百科请看这里,具体的命令格式和使用方法请自行百度. 我们先来试试拨号 向串口发送命令 : atdt10086;\r 不出意外的话Modem就会摘机,并

Microsoft speech sdk 5.1 text to speech

//用于将文字转化成的语音保存成本地的pcm文件 long CPlugin14Ctrl::OnSpeak(LPCTSTR uContents, long uVolume) { // TODO: Add your dispatch handler code here CString cStr=uContents ; //AfxMessageBox(cStr); //COM初始化: CComPtr<ISpVoice> m_cpVoice; HRESULT hr = m_cpVoice.CoCrea

C# ms speech文字转语音例子

最近突发奇想 想玩玩  文字转语音的东东   谷歌了一下 发现微软有一个TTS 的SDK   查了查相关资料  发现 还真不错  然后就开始玩玩Microsoft Speech SDK的 DEMO了 现在网上最新版好像是Microsoft Speech SDK Version 5.1    先下载下来 下载地址是  http://www.52z.com/soft/22068.html 要先安装第一个SDK 然后安装语言包    只有安装了语言包   语言包是用来支持中文翻读的 然后开始我们的C#

Csharp: speech to text, text to speech in win

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86

csharp:Google TTS API text to speech

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86

[转]Microsoft Platform SDK 选择及在vc++6.0中的配置

Windows Platform SDK Download Sites: Windows Server 2003 PSDK February 2003 Edition,可以和VC6一起使用.并支持各种目标OS的最后一个版本的SDK. This edition of the SDK supports development for the following platforms: Windows Server 2003 Windows Advanced Server, Limited Editio

Kinect 开发 &mdash;&mdash; Kinect for windows SDK

开发 -- 基本的SDK和Windows 编程技巧(彩色图像视频流,深度图像视频流的采集,骨骼跟踪,音频处理,语音识别API) 深度数据,就是Kinect的精髓和灵魂,很多问题都转换为深度图像的模式识别问题 AForge.NET 是一套C#编写的Framework,提供计算机视觉,机器学习 www.aforgenet.com 图像处理需要消耗大量的计算资源,使用C#这类托管语言并不明智,应多使用OpenCV 应用层API详解 NUI API Kinect Audio DMO :提供束波成形和音源