初探科大讯飞-讯飞开放平台之语音合成

1:讯飞开放平台提供了很多服务,有语音相关的:离线,在线语音合成及识别;人机交互;有模式识别相关的:人脸识别,声纹识别;还要云存储等等,如有兴趣,自行百度。

2:看了下官方SDK,试着体验下。导入两个jar包到lib目录,以及两个dll和so文件放到工程根目录。

本次先体验下语音合成模块。

  • 语音合成主要涉及一个类,如下,完成语音的合成
import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SynthesizerListener;

public class ttsSpeech {
	//定义两个成员变量,一个是需要合成的内容;一个是语音文件输出路径,但是科大讯飞生成的语音文件无法播放,可能有其他原因吧。
	public String content;
	public String audioOutPath;

	//构造函数
	public ttsSpeech(String content, String audioOutPath) {
		super();
		this.content = content;
		this.audioOutPath = audioOutPath;
		}

	/**
	 * 语音合成函数
	 */
	public void Synthesize() {

		SpeechSynthesizer speechSynthesizer = SpeechSynthesizer
				.createSynthesizer();
		// 设置发音人
		speechSynthesizer.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");
		// 设置语速,范围0~100
		speechSynthesizer.setParameter(SpeechConstant.SPEED, "50");
		// 设置语调,范围0~100
		speechSynthesizer.setParameter(SpeechConstant.PITCH, "50");
		// 设置音量,范围0~100
		speechSynthesizer.setParameter(SpeechConstant.VOLUME, "80");
		// 设置合成音频保存位置(可自定义保存位置),默认保存在“./iflytek.pcm”
		speechSynthesizer.setParameter(SpeechConstant.TTS_AUDIO_PATH, this.audioOutPath);
		speechSynthesizer.startSpeaking(this.content, mySynListener);
	}

	/**
	 * 合成监听器
	 */
	private static SynthesizerListener mySynListener = new SynthesizerListener() {

		@Override
		public void onBufferProgress(int arg0, int arg1, int arg2,
				String arg3) {
			// TODO Auto-generated method stub
			 //System.out.println("语音合成进度"+arg0+"-"+arg1+"-"+arg2+"\n");
		}

		@Override
		public void onCompleted(SpeechError arg0) {
			// TODO Auto-generated method stub
			 System.out.println("语音转换完成"+"\n");
			 
		}

		@Override
		public void onSpeakBegin() {
			// TODO Auto-generated method stub
			 System.out.println("开始语音转换"+"\n");
		}

		@Override
		public void onSpeakPaused() {
			// TODO Auto-generated method stub

		}

		@Override
		public void onSpeakProgress(int arg0, int arg1, int arg2) {
			// TODO Auto-generated method stub
			//System.out.println("语音播放进度"+arg0+"-"+arg1+"-"+arg2+"\n");

		}

		@Override
		public void onSpeakResumed() {
			// TODO Auto-generated method stub

		}

	};

}
  • 下面就是如何调用该类对象完成特定内容的语音合成
String content="20多年前我处在了人生的一个十字路口。随着我们用5年时间为出版社(他们希望新兴的互联网空间)打造的Deltagraph的终结";
		String path="D:/test/test.wav";
		SpeechUtility.createUtility(SpeechConstant.APPID+"=5712115d");
		System.out.println("content:"+content+":"+content.length());
		ttsSpeech tts=new ttsSpeech(content,path);
		tts.Synthesize();

执行程序后,很快就能够听到上述文本内容的语音播放,还不错。

时间: 2024-10-10 10:04:02

初探科大讯飞-讯飞开放平台之语音合成的相关文章

语音识别、语音合成使用基础(讯飞开放平台)

1.在http://www.xfyun.cn进入讯飞开放平台. 创建应用 创建完毕 下载SDK(单个或组合下载):选择服务 选择平台 选择自己之前创的应用 2.下载完毕后,将(F:\讯飞开放平台\Android_voice_1098_574d92ab\libs)libs里面的Msc.jar.armeabi复制到项目中 其中在官网的资料库-开发集成-Android平台有教你怎么使用. 例子: 1.布局分布如下 <LinearLayout xmlns:android="http://schem

讯飞开放平台上线业界首个多生物特征融合认证方案

年末岁初,是各类犯罪案件的高发时段,而其中不法分子通过倒卖.盗取他人身份信息后,利用身份认证漏洞可办理银行卡.电话卡,进而从事各种违法犯罪活动的案件近来尤为常见.从前不久微信H5链接盗取支付宝存款的谣言散播中可见广大用户对身份安全认证,尤其是金融领域的安全认证的一贯担忧.话说讯飞开放平台刚刚上线多生物特征融合认证方案,免费向业界开发者开放,“声纹+人脸”验证护航全民信息安全.一起来探讨下,到底有什么特点?案例演示地址:讯飞开放平台多生物特征融合认证方案 信息时代掉,队的身份验证 身处信息社会,如

腾讯AI开放平台使用

一.腾讯AI开放平台 https://ai.qq.com/ 二.腾讯AI平台支持的功能 三.签名机制 1.计算步骤 用于计算签名的参数在不同接口之间会有差异,但算法过程固定如下4个步骤. 1.将<key, value>请求参数对按key进行字典升序排序,得到有序的参数对列表N 2.将列表N中的参数对按URL键值对的格式拼接成字符串,得到字符串T(如:key1=value1&key2=value2),URL键值拼接过程value部分需要URL编码,URL编码算法用大写字母,例如%E8,而

讯飞语音SDK Android平台使用

1. 支持功能介绍: 2. Android API主要业务接口和流程介绍 -------------------------------------------------------- 工程代码: -------------------------------------------------------- 准备工作: 在 讯飞开放平台(http://www.xfyun.cn/)注册,下载Android版 SDK   1. 支持功能介绍: (1). 听写,语法文件识别,语义 (2). 文字合

讯飞语音识别

使用讯飞开放平台实现语音识别合成 发 社会和产品的发展总是向着便利和智能的方法发展,对于手机的App来说也是如此.所以,现在的App都在缩减流程,优化使用体验,为的就是让用户用起来更加便利,提高App的入手度和用户粘性.那么另一方面的智能呢? 一个比较简单智能的实现方法就是在输入的地方加上语音识别,在输出显示的时候加上语音合成,直接进行语音播报,那么是不是对于司机等来说就是一个智能的体现呢? 现在做语音识别有一些不错的开放平台可以给我们直接提供使用,一家是科大讯飞开放平台,一家是百度语音开放平台

Android讯飞语音云语音听写学习

讯飞语音云语音听写学习         这几天两个舍友都买了iPhone 6S,玩起了"Hey, Siri",我依旧对我的Nexus 5喊着"OK,Google".但种种原因,国内的"OK,Google"并不能展示出他的全部威力,于是上网搜索国内Android平台的语音助手,个人觉得评价最好的是讯飞的--灵犀语音助手.其实讯飞语音云平台早就注册过了,并下载了相应的SDK,只是没仔细研究.今天突然想好好学习一下,以方便以后集成到自己开发的APP中,

讯飞语音开发基础——创建应用以及开通服务

声明 如果有描述不正确或者平台有更新,欢迎指正! 讯飞开放平台: 网址:http://www.xfyun.cn/ 步骤: 1. 创建开发者帐号 右上角注册 2. 登录 右上角登录 3. 创建应用 右上角我的语音云 -> 创建新的应用 4. 填写应用信息 5. 开通服务 填写完应用信息,提交以后,跳转到我的应用,新开通的应用是默认没有开通任何服务的,我们要使用哪些功能,需要开通对应的服务 点击立即开通 选择要开通的服务,点击确定 选择完要开通的服务以后会提示下载SDK 6. 下载SDK 下载SDK

讯飞语音 使用步骤(针对androidStudio):语音转文字:

前言:最近做项目用到了讯飞语音,遂搞了一个简单的教程,供大家使用. 讯飞语音  使用步骤:语音转文字:   1,首先去讯飞开放平台( http://www.xfyun.cn/)注册,账号:   2,注册后登录: 3,点击选择我的语音云:   4,点击左侧边栏,创建新的应用: 5,创建好应用后:如图:复制appid: 6,下载sdk:  点击边栏左侧sdk下载中心: 选择我们所需要的功能和平台: 7,点击下载sdk,保存文件,并打开. //-----------------------------

Android 使用讯飞语音SDK

最近一直忙着写代码,每天的空闲时间不多.先占位,慢慢填坑. 讯飞开放平台: http://www.xfyun.cn/ 注册为开发者,然后参照文档一步步走下去. 由于是商业SDK,平台有诸多限制,免费的话只能联网,并且有限制次数,应用通过审核后无请求次数限制.