初探科大讯飞-讯飞开放平台之语音合成

1：讯飞开放平台提供了很多服务，有语音相关的：离线，在线语音合成及识别；人机交互；有模式识别相关的：人脸识别，声纹识别；还要云存储等等，如有兴趣，自行百度。

2：看了下官方SDK，试着体验下。导入两个jar包到lib目录，以及两个dll和so文件放到工程根目录。

本次先体验下语音合成模块。

语音合成主要涉及一个类，如下，完成语音的合成

import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SynthesizerListener;

public class ttsSpeech {
	//定义两个成员变量，一个是需要合成的内容；一个是语音文件输出路径，但是科大讯飞生成的语音文件无法播放，可能有其他原因吧。
	public String content;
	public String audioOutPath;

	//构造函数
	public ttsSpeech(String content, String audioOutPath) {
		super();
		this.content = content;
		this.audioOutPath = audioOutPath;
		}

	/**
	 * 语音合成函数
	 */
	public void Synthesize() {

		SpeechSynthesizer speechSynthesizer = SpeechSynthesizer
				.createSynthesizer();
		// 设置发音人
		speechSynthesizer.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");
		// 设置语速，范围0~100
		speechSynthesizer.setParameter(SpeechConstant.SPEED, "50");
		// 设置语调，范围0~100
		speechSynthesizer.setParameter(SpeechConstant.PITCH, "50");
		// 设置音量，范围0~100
		speechSynthesizer.setParameter(SpeechConstant.VOLUME, "80");
		// 设置合成音频保存位置（可自定义保存位置），默认保存在“./iflytek.pcm”
		speechSynthesizer.setParameter(SpeechConstant.TTS_AUDIO_PATH, this.audioOutPath);
		speechSynthesizer.startSpeaking(this.content, mySynListener);
	}

	/**
	 * 合成监听器
	 */
	private static SynthesizerListener mySynListener = new SynthesizerListener() {

		@Override
		public void onBufferProgress(int arg0, int arg1, int arg2,
				String arg3) {
			// TODO Auto-generated method stub
			 //System.out.println("语音合成进度"+arg0+"-"+arg1+"-"+arg2+"\n");
		}

		@Override
		public void onCompleted(SpeechError arg0) {
			// TODO Auto-generated method stub
			 System.out.println("语音转换完成"+"\n");
			 
		}

		@Override
		public void onSpeakBegin() {
			// TODO Auto-generated method stub
			 System.out.println("开始语音转换"+"\n");
		}

		@Override
		public void onSpeakPaused() {
			// TODO Auto-generated method stub

		}

		@Override
		public void onSpeakProgress(int arg0, int arg1, int arg2) {
			// TODO Auto-generated method stub
			//System.out.println("语音播放进度"+arg0+"-"+arg1+"-"+arg2+"\n");

		}

		@Override
		public void onSpeakResumed() {
			// TODO Auto-generated method stub

		}

	};

}

下面就是如何调用该类对象完成特定内容的语音合成

String content="20多年前我处在了人生的一个十字路口。随着我们用5年时间为出版社（他们希望新兴的互联网空间）打造的Deltagraph的终结";
		String path="D:/test/test.wav";
		SpeechUtility.createUtility(SpeechConstant.APPID+"=5712115d");
		System.out.println("content:"+content+":"+content.length());
		ttsSpeech tts=new ttsSpeech(content,path);
		tts.Synthesize();

执行程序后，很快就能够听到上述文本内容的语音播放，还不错。

时间： 2024-10-10 10:04:02

初探科大讯飞-讯飞开放平台之语音合成的相关文章

语音识别、语音合成使用基础（讯飞开放平台）

1.在http://www.xfyun.cn进入讯飞开放平台. 创建应用创建完毕下载SDK(单个或组合下载):选择服务选择平台选择自己之前创的应用 2.下载完毕后,将(F:\讯飞开放平台\Android_voice_1098_574d92ab\libs)libs里面的Msc.jar.armeabi复制到项目中其中在官网的资料库-开发集成-Android平台有教你怎么使用. 例子: 1.布局分布如下 <LinearLayout xmlns:android="http://schem

讯飞开放平台上线业界首个多生物特征融合认证方案

年末岁初,是各类犯罪案件的高发时段,而其中不法分子通过倒卖.盗取他人身份信息后,利用身份认证漏洞可办理银行卡.电话卡,进而从事各种违法犯罪活动的案件近来尤为常见.从前不久微信H5链接盗取支付宝存款的谣言散播中可见广大用户对身份安全认证,尤其是金融领域的安全认证的一贯担忧.话说讯飞开放平台刚刚上线多生物特征融合认证方案,免费向业界开发者开放,“声纹+人脸”验证护航全民信息安全.一起来探讨下,到底有什么特点?案例演示地址:讯飞开放平台多生物特征融合认证方案信息时代掉,队的身份验证身处信息社会,如

腾讯AI开放平台使用

一.腾讯AI开放平台 https://ai.qq.com/ 二.腾讯AI平台支持的功能三.签名机制 1.计算步骤用于计算签名的参数在不同接口之间会有差异,但算法过程固定如下4个步骤. 1.将<key, value>请求参数对按key进行字典升序排序,得到有序的参数对列表N 2.将列表N中的参数对按URL键值对的格式拼接成字符串,得到字符串T(如:key1=value1&key2=value2),URL键值拼接过程value部分需要URL编码,URL编码算法用大写字母,例如%E8,而

讯飞语音SDK Android平台使用

1. 支持功能介绍: 2. Android API主要业务接口和流程介绍 -------------------------------------------------------- 工程代码: -------------------------------------------------------- 准备工作: 在讯飞开放平台(http://www.xfyun.cn/)注册,下载Android版 SDK 1. 支持功能介绍: (1). 听写,语法文件识别,语义 (2). 文字合

讯飞语音识别

使用讯飞开放平台实现语音识别合成发社会和产品的发展总是向着便利和智能的方法发展,对于手机的App来说也是如此.所以,现在的App都在缩减流程,优化使用体验,为的就是让用户用起来更加便利,提高App的入手度和用户粘性.那么另一方面的智能呢? 一个比较简单智能的实现方法就是在输入的地方加上语音识别,在输出显示的时候加上语音合成,直接进行语音播报,那么是不是对于司机等来说就是一个智能的体现呢? 现在做语音识别有一些不错的开放平台可以给我们直接提供使用,一家是科大讯飞开放平台,一家是百度语音开放平台

Android讯飞语音云语音听写学习

讯飞语音云语音听写学习这几天两个舍友都买了iPhone 6S,玩起了"Hey, Siri",我依旧对我的Nexus 5喊着"OK,Google".但种种原因,国内的"OK,Google"并不能展示出他的全部威力,于是上网搜索国内Android平台的语音助手,个人觉得评价最好的是讯飞的--灵犀语音助手.其实讯飞语音云平台早就注册过了,并下载了相应的SDK,只是没仔细研究.今天突然想好好学习一下,以方便以后集成到自己开发的APP中,

讯飞语音开发基础——创建应用以及开通服务

声明如果有描述不正确或者平台有更新,欢迎指正! 讯飞开放平台: 网址:http://www.xfyun.cn/ 步骤: 1. 创建开发者帐号右上角注册 2. 登录右上角登录 3. 创建应用右上角我的语音云 -> 创建新的应用 4. 填写应用信息 5. 开通服务填写完应用信息,提交以后,跳转到我的应用,新开通的应用是默认没有开通任何服务的,我们要使用哪些功能,需要开通对应的服务点击立即开通选择要开通的服务,点击确定选择完要开通的服务以后会提示下载SDK 6. 下载SDK 下载SDK

讯飞语音使用步骤(针对androidStudio)：语音转文字：

前言:最近做项目用到了讯飞语音,遂搞了一个简单的教程,供大家使用. 讯飞语音使用步骤:语音转文字: 1,首先去讯飞开放平台( http://www.xfyun.cn/)注册,账号: 2,注册后登录: 3,点击选择我的语音云: 4,点击左侧边栏,创建新的应用: 5,创建好应用后:如图:复制appid: 6,下载sdk: 点击边栏左侧sdk下载中心: 选择我们所需要的功能和平台: 7,点击下载sdk,保存文件,并打开. //-----------------------------

Android 使用讯飞语音SDK

最近一直忙着写代码,每天的空闲时间不多.先占位,慢慢填坑. 讯飞开放平台: http://www.xfyun.cn/ 注册为开发者,然后参照文档一步步走下去. 由于是商业SDK,平台有诸多限制,免费的话只能联网,并且有限制次数,应用通过审核后无请求次数限制.