文字转语音,语音合成,文字语音播报---解决过程

做了很久生产项目 经常遇到一个问题:就是想把文字用语音播报出来;当然了声音要清晰,好听,不能太机械。  这个问题怎么解决呢?一般不外乎两种方法,第一种,将文字录成MP3格式用控件播放。另外一种:直接文字语音播报。

我一直都是用第一种方法居多,但是最近遇到个棘手的事情,就是数量巨大和文字变动较大。因此深入研究了下,记录下过程。

第一种方法:就是费时费力但是好处是人工转换了删选了效果比较好。但是两大或者文字变动 是个大隐患。

第二种方法:用微软自带的tts引擎,效果不好。播放不清晰,好处是com组件各种语言都可以用。

但是我又必须用第二种方法来实现,测试了众多语音引擎,终于找到合适自己的了。(c#调用,离线转换)

我的思路是这样的:

首先,是想找到合适语音引擎,引擎好,朗读的效果肯定ok。测试了一下众多语音引擎。国内人最了解自己了,当然从国内的先找起

百度语音:效果不错,在线转换为主,在线转换有次数限制,但是如果离线要申请,离线序列号,没找到c#调用方法,忽略。

讯飞语音:效果不错,在线转换为主,在线转换有次数限制,但是如果离线则需要购买,没找到c#调用方法,忽略。

okvocie,hivoice,sogou 等等 都是一个德行。都忽略。花了太多时间。

ispeech:效果不错,在线转换,付费,有c#调用,不错,收费。忽略。

necospeech:效果相当不错,在线转换,个人最喜欢的,在线转换,付费。没找到下载方法。

espeak:效果不错。离线转换,国人开发的,但是没有女声,达到一半要求。

还有其他国外好多,没有一个达到要求了。做了这些事情已经花了我一整天时间了,怎么办

用espeak 语音的人可以选择。难道下载语音库就可以了?????心里有些小激动了。。

突然搜索到灵格斯词霸有各种语音库下载, 看到有necospeech的  400m 我下载下来了。测试居然可以。明白了一个道理:下载支持微软件tts引擎的语音库,按照微软件tts调用方法直接调用即可。原来如此。

网上已经好心人造了轮子了,我借用下。

以下是具体操作步骤

1.win7 自带sapi4. 应该不需要下载,如果需要可以下载微软tts sdk

2.http://www.cnblogs.com/comsokey/archive/2011/10/04/2199030.html

3.下载necospeech的语音库安装即可。 necospeech vw Lily的效果不错。

4.在控制面板语音识别里面测试效果。

5.http://www.cnblogs.com/daytoday/archive/2013/02/17/2914124.html  园友林尚轩的这边文章说的清楚了。

6.到此结束。已经晚上11点了,花了10几个小时了。不过值得了。

时间: 2024-10-22 10:17:17

文字转语音,语音合成,文字语音播报---解决过程的相关文章

iOS语音识别,语音播报,文字变语音播报,语音变文字

首先使用的是科大讯飞的sdk 1.语音识别部分 AppDelegate.m #import "AppDelegate.h" #import <iflyMSC/iflyMSC.h> @interface AppDelegate () @end @implementation AppDelegate - (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictiona

科大讯飞(2) 语音合成(文字转换成语音)

科大讯飞开放平台.SDK下载.添加静态库.初始化见UI进阶 科大讯飞(1) 语音听写(语音转换成文字) 实现语音合成 功能实现步骤: 导入头文件 创建文字识别对象 指定文字识别后的回调代理对象 开启文字识别功能 在回调方法中处理文字识别后返回的对象 文字合成中的参数: 代码展示: 1 //文字识别的回调方法接口 2 #import <iflyMSC/IFlySpeechSynthesizerDelegate.h> 3 4 //文字识别对象 5 #import <iflyMSC/IFlyS

「微信同声传译」小程序插件:快速实现语音转文字、文本翻译、语音合成等能力

上期,我们在<「医院 LBS 位置服务」插件:输出LBS室内位置能力,为改善就医服务提供解决方案>一文中介绍了「医院 LBS 位置服务」小程序插件的意义.使用场景以及使用方法. 今天我们为大家推荐的插件是「微信同声传译」,如果你想在小程序中拥有快速实现语音转文字.文本翻译.语音合成等能力,那么「微信同声传译插件」是你的不二选择.接下来,我们将从使用场景到使用方法,为你作出详细的介绍. 「微信同声传译」插件能做什么? 今天我们说到的「微信同声传译」插件,是由微信智聆语音团队.微信翻译团队与公众平

iOS 10中如何搭建一个语音转文字框架

在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的语音识别框架,但是它们要么太贵要么不好.在今天的教程里面,我会教你怎样创建一个使用Speech Kit来进行语音转文字的类似Siri的app. 设计App UI 前提:你需要Xcode 8 beta版本和一个运行iOS 10 beta系统版本的iOS 设备.先从创建一个新的命名为SpeechToTe

iOS上传语音、文字、图片

需求:用户可能提交 文字,也可能有语音,还有可能有图片.当然 都有也是可以的. 在这里我的方案是 先做判断(因为我提交的类不同(也就是方法不一样)): (1)if (_imageArray.count == 0 && recordingInterval == 0){ //只有文字 }else{ // 文字 图片 加录音 } 方法: // 有文字,有图,片有语音 +(void)askTextImageByUserInfoId:(NSString *)userInfoId WithUserRe

如何把语音转文字转换

在很多的时候,大家都会遇到要把语音文件转成文字的困扰,尤其是在工作中,更是如此,毕竟所有的工作不可能是那么的简单的,一般在遇到这样的问题的时候,我会采用下面的方法,接下来分享给大家吧.使用工具:迅捷PDF转换器1.一般情况下,要对于语音转成文字的话,大家也都知道,用一个辅助工具来转换就比较方便了,就比如用PDF转换器吧,就可以把语音转成文字了.2.先将转换器打开,用鼠标点击界面下面的转换功能,便是语音转文字的功能.3.点击好功能,打开保存语音文件的文件夹,用鼠标点击该文件夹,将文件添加到转换器中

语音怎么在线转文字,语音转文字的小技巧

在办公中经常需要将语音文件转换成文字格式,比如说在领导开会的时候需要将开会的内容录音下来,并以文本的形式发送给领导,这个时候我们是将语音文件一边听一边手打输送出来嘛,其实根本就不需要这么麻烦的.今天小编就给大家介绍一种在线将语音转换成文字并且可以同步为英文的操作方法.操作工具:[迅捷语音云服务]第一步:将需要转换成文字的语音在电脑上准备好,然后再通过电脑浏览器搜索迅捷语音云服务,来帮助我们进行转换.第二步:进入到语音与服务页面后,在页面中心可以看到两个转换选项,根据需要从中选择语音转文字的选项即

讯飞语音 使用步骤(针对androidStudio):语音转文字:

前言:最近做项目用到了讯飞语音,遂搞了一个简单的教程,供大家使用. 讯飞语音  使用步骤:语音转文字:   1,首先去讯飞开放平台( http://www.xfyun.cn/)注册,账号:   2,注册后登录: 3,点击选择我的语音云:   4,点击左侧边栏,创建新的应用: 5,创建好应用后:如图:复制appid: 6,下载sdk:  点击边栏左侧sdk下载中心: 选择我们所需要的功能和平台: 7,点击下载sdk,保存文件,并打开. //-----------------------------

C# 语音识别(文字to语音、语音to文字)

C# 语音识别(文字to语音.语音to文字) 最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe                   (67.0 MB) 2)SpeechSDK51LangPack.exe     (81.0 MB) API可以不下载,但是如果你的VS是英文版,但是想使用中文的语音,那你就需要下载API,按顺序安装好. (PS:我的VS是英文的,不能说中文,为了这个我纠结了一上午