C# 百度语音合成

语音合成及TTS,我们尝试使用百度的语音合成技术 不过我发现

有一种缺点在于没有离线包让我有些很不舒服,可能是在线版的

原因微软语音识别技术在Windows 2000是默认集成在系统组件中

或许我们不必去寻找新的语音合成替代方案,不过在线版一旦离线

只有Game Over,Hah不过有一点好处在于使用方便适合广发开发

者,第二百度语音合成后的音频流,妹子的声音听着较舒服 如果可

以在“卡哇伊”的萌妹妹,一定会更好,不过应该在解决一下声音坚

硬的感觉或许会更好,虽然语音合成技术发展这么多年 至少目前我

还没有见到有什么服务可以提供与人说话的自然感,始终会有些机

械干不过要谈到“百度语音识别”与“光学识别 / OCR”的话,我不好意

思讨论 但是支持国产的心是不变的,不过百度的文档只有那么简洁

我可以断定一定是百度的开发人员做的,Hah 我们又不是日本人与

印度人写不好什么注释与文档,人家那是写作文 我们能造吗?

首先你需要具备一个百度账号,然后到新版百度语音的官方的首页

http://yuyin.baidu.com/fc.html

届时你会看到上面的两种不同的技术,我们选择语音合成技术

你可以试试快速体验实际上它就是利用REST API实现的,不要纠结

我们点击立即使用,如果是第一次使用百度的技术服务 那么你需要

注册开发者信息一次 烂填最好 免得百度把你的信息哪去卖钱,Hah.

如果是你已经登记信息,没有创建应用你也无法使用百度的服务

你必须创建一个项目,在下图如所示右上角“创建新应用”

那么你会看见如下页面,随意填写一个有效名称确认即可 应用类别

也是随意选择,搞那么清楚给百度干什么 只是用服务 又不是卖信息

当应用创建完毕后你会看到如下的页面,那么你需要点击开通服务

如果你没有看到开通服务的标签按钮,可以回到百度语音支持首页

选择“百度语音合成”然后直接点击“立即使用”

它会提示你选择你的应用随便选择一个充数就可以,然后点击下一步

如果提示如下页面表示成功,你也可以直接点击上图右边的“创建应用”

超链接快速开通服务

好吧,如果有需要百度帮助文档的可以去“应用管理”页面点击你需

要的技术按钮,会弹出如下的快捷菜单 选择“下载SDK”即可,或者

从百度语音支持首页选择“百度语音合成”

点击工具栏中的“相关下载”后我们选择“REST API”选项卡,请参照下图

点击下载文档,不过百度的文档你或许看了可能会认为没有看过 Hah。

现在我们需要去“获取 Access Token”又是百度搞出来的新玩意

我们需要进入“应用管理”页面中点击包含“百度语音识别”技术的

应用,点击“查看Key”图形按钮,会出现如下图所示

我们现在需要提取两个重要的参数及API Key、Secret Key话

说为什么叫做“秘密Key”我估摸着是与密码差不多的一个玩意

我们根据文档拼接一个连接用于查询自己的“Access Token”

https://openapi.baidu.com/oauth/2.0/token?

grant_type=client_credentials&

client_id=hINQTsu6G8C6XqwFvfbWT7Tm&

client_secret=8d5dbdb1b92bf945dca42f75c9eb1a69

解释:

grant_type // 授权类型

client_id // API Key

client_secret // Secret Key

在浏览中访问了上面的连接会看到如上图的文本Json代码

我们什么只需要“access_token / 访问令牌”中的东西其他直

接删删删 没什么太大的作用

下面开始用C#编写使用百度语音合成服务的代码,首先我们

需要知道,百度语音合成后输出的音频流是mp3不是wav所

以我们需要播放该音频流则需要求助支持mp3音频格式的媒体

库,不过我们只是简单的播放它的音频而不是需要制作音乐播

放器,那么使用mci是最方便与节省内存的一个办法

        private const string lan = "zh";
        private const string per = "0";
        private const string ctp = "1";
        private const string spd = "3";
        private const string pit = "6";
        private const string vol = "9";
        private const string cuid = "00-12-7B-16-74-8D";
        private const string tex = "远去的山河 沉寂,恋过的风景 如昔" +
                                   "苍何斩落了 情迷,生死轻付了 别离" +
                                   "捣一脉相思 成泥,沐四海悲风 无迹" +
                                   "往生海烟波 又起,妙华镜风雪 共历";
        private const string tok = "24.fffd842a3fe829c873fe1c4cd0cb9c4e.2592000.1439044224.282335-6396988";
        private const string rest = "tex={0}&lan={1}&per={2}&ctp={3}&cuid={4}&tok={5}&spd={6}&pit={7}&vol={8}";

        private const int NULL = 0, ERROR_SUCCESS = NULL;
        [DllImport("WinMm.dll", CharSet = CharSet.Auto, CallingConvention = CallingConvention.StdCall)]
        private static extern int mciSendString(string lpstrCommand, string lpstrReturnString, int uReturnLength, int hwndCallback);

从上面的代码你或许会很疑惑为什么或有那么多常量那么你看下图

你便知道了,有些观看文档的朋友则不用

现在是不是发现与上述常量相同呢?它是“百度语音合成”所需要

的一些“必要或可选”的参数,我们在这里使用POST的方式主要

在于使用GET方式显得我有些太屌了,虽然文档内是GET方式

        protected override void OnLoad(EventArgs e)
        {
            string strUpdateData = string.Format(rest, tex, lan, per, ctp, cuid, tok, spd, pit, vol);
            HttpWebRequest req = WebRequest.Create("http://tsn.baidu.com/text2audio") as HttpWebRequest;
            req.Method = "POST";
            req.ContentType = "application/x-www-form-urlencoded";
            req.ContentLength = Encoding.UTF8.GetByteCount(strUpdateData);
            using (StreamWriter sw = new StreamWriter(req.GetRequestStream()))
                sw.Write(strUpdateData);
            HttpWebResponse res = req.GetResponse() as HttpWebResponse;
            using (Stream stream = res.GetResponseStream())
            {
                string strFullFileName = Application.StartupPath + "/app.mp3";
                using (FileStream fs = new FileStream(strFullFileName, FileMode.Truncate | FileMode.OpenOrCreate, FileAccess.ReadWrite, FileShare.ReadWrite))
                    stream.CopyTo(fs);
                if (mciSendString(string.Format("open \"{0}\" alias app", strFullFileName), null, NULL, NULL) == ERROR_SUCCESS)
                    mciSendString("play app", null, NULL, NULL);
            }
        }

.NET POST的方式无外乎那几种,一般最常用的还是

.NET上层提供HttpWebRequest,不过百度语音识别

要求使用UTF-8的字符串POST,一定注意这里的细节

否则你无法使用百度提供的服务,而对你返回错误代码

想必这些细节作为一个开发人员应该是不会犯的

我们把POST后返回的HTTP流写到文件,不过在上面

我说过百度是返回的mp3流,那么你就需要以mp3的方

式写到文件,如果使用BASS则不必它可以播放内存中

的媒体流,不过mci方式则不可以,如果你没有看懂代码

又急需要使用可以拷贝我的代码 不过建议你能读懂最好

依赖的命名空间:

using System.Net;
using System.IO;
using System.Text;
using System.Runtime.InteropServices;

到这里基本结束了,百度语音合成 在C#中的使用并不是

你想象中的那么困难,你没有必要去纠结它的使用方法

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-08-28 18:02:08

C# 百度语音合成的相关文章

微信学习总结 15 百度语音合成

百度语音合成通过REST API的方式给开发者提供一个通用的HTTP接口,基于该接口,开发者可以轻松的获取语音合成能力,本文档描述了使用语音合成服务REST API的方法. 对本文中将提到的名词约定如下: 语音合成:也被称为文本转换技术(TTS),它是将计算机自己产生的.或外部输入的文字信息转变为可以听得懂的.流利的口语输出的技术. 应用程序:在开发中调用了API.具有语音合成功能的产品线产品. 功能介绍 REST API支持对一段文本的合成,其中对于文本格式以及参数有一定的要求.请按照文档中描

Android Studio下Android应用开发集成百度语音合成使用方法样例

转载请注明来源: http://blog.csdn.net/kjunchen/article/details/51093134 Android Studio下Android应用开发集成百度语音合成使用方法样例 首先,语音合成是指将文本信息转换成声音.意思就是将文本转化为声音,让你的应用开口说话.国内在业内比较有名的第三方语音合成平台有百度语音和科大讯飞. 本博文集成的是百度语音合成,其主要特点是: 完全永久免费 业界首创完全永久免费新形式,为开发者提供最流畅最自然的语音合成服务.完全免费,永久使

百度语音合成(TTS)SDK使用方法

语音合成是实现人机语音交互,建立一个有听和讲能力的交互系统所必需的关键技术. 这篇文章将介绍如何使用百度Android语音合成SDK. 与语音识别SDK类似,使用语音合成SDK也需要注册,并开启语音合成API服务,详细步骤可以参考   点击打开链接        中的注册部分. 百度语音合成SDK以JAR包+动态链接库形式发布,需要开发者在        点击打开链接      下载SDK开发包,并将libs文件夹拷贝到工程中 申请必要的权限 [java] view plaincopy <use

百度语音合成AI

注意:不要使用Dw编辑PHP代码,会因为编码问题出错!!<?php require_once 'AipSpeech.php'; // 你的 APPID AK SK const APP_ID = '112***00'; const API_KEY = '6EkSeI*****aFV4GjpB2q'; const SECRET_KEY = 'mSPm*******qayf81XSbYBxu'; $client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);

百度语音合成简单案例(将文字转化为相应的语音)

参考链接:http://ai.baidu.com/docs#/TTS-API/top 1.项目的目录结构 2.效果图 3核心代码 TtsMain.java package com.baidu.speech.restapi.ttsdemo; import com.baidu.speech.restapi.common.DemoException; import com.baidu.speech.restapi.common.ConnUtil; import com.baidu.speech.res

百度语音合成api/sdk及demo

1.流程 1)换取token 用Api Key 和 SecretKey.访问https://openapi.baidu.com/oauth/2.0/token 换取 token // appKey = Va5yQRHl********LT0vuXV4 // appSecret = 0rDSjzQ20XUj5i********PQSzr5pVw2 https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&clie

vue 实现百度语音合成(语音播报)

这里我完全依照百度提供的语音合成api来做:https://ai.baidu.com/docs#/TTS-Online-Node-SDK/top 直接去看node.js SDK. 1.换取access_token: 参考:https://ai.baidu.com/docs#/TTS-API/top,在这里用浏览器换取token 2.下载sdk依赖: npm install baidu-aip-sdk 完整代码(非原创,参考了一个demo,但是很久以前写的找不到了): btts(text) { c

csharp: 百度语音合成

public string API_id = "3333"; //你的ID public string API_record = null; public string API_record_format = null; public string API_record_HZ = null; public string API_key = "geovindu"; //你的KEY public string API_secret_key = "geovind

文本转音频(百度语音合成api)(python)

1,UI界面设计(精简设计),使用tk框架 功能说明:1,文本标记功能整合进程序中:2,联网的http API接口整合: 1,网络检查: 2,断网异常检测: 3,网络传数据.接数据:3,文本转语音的baidu-api接口整合 1,语速,取值0-9,默认为5中语速: 2,音调,取值0-9,默认为5中语调: 3,音量,取值0-15,默认为5中音量: 4,发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女:4,音频保存自主设置: 注:其中的逗号.句号重复是甲方要