科大讯飞(1) 语音听写(语音转换成文字)

一、科大讯飞开放平台：

http://www.xfyun.cn/

因为本项目只实现了语音听写，所以在SDK下载中心勾选语音听写单项SDK就可以了

开发平台选择iOS，应用选择你要实现语音听写的应用，然后点击"下载SDK"按钮

程序中会用到Appid，程序中导入的SDK一定是要与这个应用相关联的SDK，下载下来的SDK压缩包就是以Appid结尾命名的。

二、项目配置

官方文档：http://www.xfyun.cn/doccenter/iOS

1、添加静态库

按下图添加SDK所需要的iOS库，请注意libz.dylib，CoreTelephoney.framework不要遗漏。

注：如果使用的是离线识别，还需要增加libc++.dylib。

2、初始化

必须在初始化后才可以使用语音服务，初始化是异步过程，推荐在程序入口处调用。

Appid是应用的身份信息，具有唯一性，初始化时必须要传入Appid。可以从demo的Definition.h APPID_VALUE中查看此信息。Demo和SDK申请地址：http://xfyun.cn

在AppDelegate.m的didFinishLaunchingWithOptions:方法中初始化

先导入头文件：

#import "iflyMSC/IFlySpeechUtility.h"

1 - (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions {
2     // Override point for customization after application launch.
3     // 登录科大讯飞语音平台
4     NSString *initString = [[NSString alloc] initWithFormat:@"appid=%@", @"5750da0e"];
5     [IFlySpeechUtility createUtility:initString];
6     return YES;
7 }

3、实现语音听写(语音转换成文字)：

功能实现步骤：

导入头文件
创建声音识别视图
指定声音识别后回调的代理对象
开启声音识别功能
在回调方法中处理声音识别后返回的对象

语音识别中的参数：

 1 //第一步：引入库文件
 2 //科大讯飞语音识别功能回调方法的接口文件
 3 #import <iflyMSC/IFlyRecognizerViewDelegate.h>
 4 //科大讯飞语音识别功能的声音识别视图
 5 #import <iflyMSC/IFlyRecognizerView.h>
 6 //科大讯飞语音识别功能中定义的常量
 7 #import <iflyMSC/IFlySpeechConstant.h>
 8
 9 // 遵循代理协议
10 @interface FirstViewController ()<IFlyRecognizerViewDelegate>
11
12 @property (weak, nonatomic) IBOutlet UITextView *wordTextView;
13
14 /// 语音识别对象
15 @property (nonatomic, strong) IFlyRecognizerView *iflyRecognizerView;
16
17 /// 可变字符串接收相关的结果
18 @property (nonatomic, copy) NSMutableString *resultStr;
19 @end
20
21 @implementation FirstViewController
22
23 - (void)viewDidLoad {
24     [super viewDidLoad];
25     /**
26      语音识别文字
27      */
28     // 初始化语音识别控件
29     self.iflyRecognizerView = [[IFlyRecognizerView alloc] initWithCenter:self.view.center];
30     // 设置代理
31     self.iflyRecognizerView.delegate = self;
32
33     //设置语音识别结果应用为普通文本领域
34     [self.iflyRecognizerView setParameter: @"iat" forKey:[IFlySpeechConstant IFLY_DOMAIN]];
35     //设置前端点检测时间为6000ms
36     [self.iflyRecognizerView setParameter: @"6000" forKey:[IFlySpeechConstant VAD_BOS]];
37     //设置后端点检测时间为700ms
38     [self.iflyRecognizerView setParameter: @"700" forKey:[IFlySpeechConstant VAD_EOS]];
39     //设置采样率为8000
40     [self.iflyRecognizerView setParameter: @"8000" forKey:[IFlySpeechConstant SAMPLE_RATE]];
41     //设置为返回结果中包含标点符号
42     [self.iflyRecognizerView setParameter: @"1" forKey:[IFlySpeechConstant ASR_PTT]];
43     //设置语音识别完成后数据的返回数据结构类型xml
44     [self.iflyRecognizerView setParameter: @"plain" forKey:[IFlySpeechConstant RESULT_TYPE]];
45     //设置在Documents文件夹下缓存的文件名为temp.asr
46     [self.iflyRecognizerView setParameter: @"temp.asr" forKey:[IFlySpeechConstant ASR_AUDIO_PATH]];
47     //设置自定义的参数
48     [self.iflyRecognizerView setParameter: @"custom" forKey:[IFlySpeechConstant PARAMS]];
49
50
51 }
52
53 #pragma mark - 语音识别文字
54 - (IBAction)recognizeAction:(UIButton *)sender {
55
56     // 开始识别语音
57     [self.iflyRecognizerView start];
58
59 }
60
61
62 #pragma mark - 代理方法
63 /*!
64  *  回调返回识别结果
65  *
66  *  @param resultArray 识别结果，NSArray的第一个元素为NSDictionary，NSDictionary的key为识别结果，sc为识别结果的置信度
67  *  @param isLast      -[out] 是否最后一个结果
68  */
69 // 成功
70 - (void)onResult:(NSArray *)resultArray isLast:(BOOL) isLast {
71     self.resultStr = [[NSMutableString alloc] init];
72     NSDictionary *dic = [resultArray objectAtIndex:0];
73
74     for (NSString *key in dic)
75     {
76         [self.resultStr appendFormat:@"%@",key];
77     }
78     NSLog(@"%@---------",_resultStr);
79
80     self.wordTextView.text = [NSString stringWithFormat:@"%@%@",self.wordTextView.text,self.resultStr];
81 }
82
83 /*!
84  *  识别结束回调
85  *
86  *  @param error 识别结束错误码
87  */
88 // 失败
89 - (void)onError: (IFlySpeechError *) error {
90     NSLog(@"%@", error);
91 }
92
93 @end

时间： 2024-10-08 09:21:45

科大讯飞(1) 语音听写(语音转换成文字)的相关文章

电脑上接收到的语音文件怎么转换成文字内容

电脑上接收到的语音文件怎么转换成文字内容,现在这念头很多合作伙伴也会发出语音邮件进行洽谈,如果一边听一边将文字书写下来,会非常麻烦,而且效率并不高,那如何在线将语音转换成文字的呢?第一步:将需要转换成文字的语音在电脑上准备好,然后再通过电脑浏览器搜索迅捷语音云服务,来帮助我们进行转换.第二步:进入到语音与服务页面后,在页面中心可以看到两个转换选项,根据需要从中选择语音转文字的选项即可.第三步:进入到语音转换文字的选项后,就可以通过页面中心的录音图标将语音文件添加进来了.第四步:语音文件添加进来后

语音如何转换成文字的方法

语音如何快速转换成文字?当我们在学习中或是在学习中我们都有可能会遇到一些语音转文字,那么我们是怎么在线将语音转换成文字的呢?下面小编就简单给大家介绍一下. 步骤一:语音转文字的方法其实很简单,我们可以直接在浏览器上进行搜索迅捷语音云服务进入到在线网中进行转换: 步骤二:进入之后就可以进行在线转换的语音设置了,将文字语言和使用场景设置好:步骤三:然后进行语音文件的选择,将语音文件选择到界面中,可以直接进行拖动或是点击文件进行上传即可:步骤四:等文件上传完成之后就可进行转换了,点击开始转换文件即可进

UI进阶科大讯飞(1) 语音听写(语音转换成文字)

一.科大讯飞开放平台: http://www.xfyun.cn/ 注册.登录之后创建新应用. 因为本项目只实现了语音听写,所以在SDK下载中心勾选语音听写单项SDK就可以了开发平台选择iOS,应用选择你要实现语音听写的应用,然后点击"下载SDK"按钮程序中会用到Appid,程序中导入的SDK一定是要与这个应用相关联的SDK,下载下来的SDK压缩包就是以Appid结尾命名的. 二.项目配置官方文档:http://www.xfyun.cn/doccenter/iOS 1.添加静态库

利用百度语音识别接口将语音转换成文字教程

一.说明如果有一个工具能识别音视中的语音并转换成文字输出,由于可以复制粘贴而不需要逐字逐句地打,那我们进行为音频配字幕工作时将会事半功倍. 其中的关键点是音文转换,音文转换其实在很多地方都可以看到比如qq,百度搜索,讯飞输入法等等,具体到技术而言前述的三个场景其背后的技术都是一样的,都是利用AI进行语音识别.而且腾讯.百度.讯飞当前都开放了自家的语音识别接口免费使用,本文就是利用的百度语音识别接口实现的转换. 其实就配字幕这种工作而言,当前应该可以实现通过写代码自动给音频文件配上字幕,复制粘贴

怎样将录制的语音转换成文字？

有的时候不方便接收语音时,遇到的语音文件又比较多的情况下,我们需要将语音转换文字,下面小编就交给大家一个简单的解决方法.步骤一:需要将录制的语音转换成文字的方式很简单,直接进入到在线转换中进行: 步骤二:进入之后就可以进行文字语言和使用场景的定义,选择好定义的类型: 步骤三:之后可以点击选择文件,将文件选择到界面中,然后点击打开: 步骤四:上传好文件之后就可以进行文件的转换,可以点击文件的转换,开始转换: 步骤五:转换的时候需要一定的时间,我们需要耐心的等待一段时间,等文件转换完成:步骤六:转换

如何将语音转换成文字？转换方法介绍

语音转换成文字方简单,只需要借助到转换工具就可以了,转换工具有着强大的转换功能,可以轻松实现你想要的转换,不知道转换方法的话,来看看下面的介绍你就会知道!转换的具体方法如下:1:打开语音转文字转换器,点击页面中的[录音转文字]()按钮.2:添加要进行转换的语音文件,页面中有选择文件夹和选择文件的按钮,点击就可以进行文件的选择.3:语音文件选择号之后,文件会在页面中展现出来,添加几个文件就会按序排列在列表中.4:选择转换的设置,在页面下面设置的有语音转换设置,点击那个设置的小图标会弹出一个窗口,里

电话录音怎么在线转换成文字内容

电话录音怎么在线转换成文字内容,很多朋友在办公中都会遇到接听电话,有的时候电话内容过于重要需要将其录音下来保存成文字内容递交给上级,那这是怎么进行操作的呢,小编这就来告诉你.第一步:将需要转换成文字的语音在电脑上准备好,然后再通过电脑浏览器搜索迅捷语音云服务,来帮助我们进行转换.第二步:进入到语音与服务页面后,在页面中心可以看到两个转换选项,根据需要从中选择语音转文字的选项即可.第三步:进入到语音转换文字的选项后,就可以通过页面中心的录音图标将语音文件添加进来了.第四步:语音文件添加进来后,在文

如何快速的把录音转换成文字

在很多情况下我们都需要把别人说的话录制下来保存,当做以后的证据,但我们需要把录音中人说的话转换成文档文字,这时候该怎么办呢?下面分享一个方法,可以轻松搞定录音转文字这个难题,就是使用专业的语音识别软件,把录音识别成文字,然后保存到TXT文档中.使用工具:迅捷OCR文字识别工具:工具特色:这个OCR文字识别工具,可以识别很多种格式的图片如:pdf.jpg.png.bmp等等,可以将图片上的文字转换到文档中,还可以把语音转换成文字,功能齐全,操作简单,网上的口碑也是一直都不错的.操作方法:1:可以通

图片转换成文字的方法

图像辨认,是指运用计算机对图像进行处理.分析和了解,以辨认各种不一样方式的政策和对像的技术.一般工业运用中,选用工业相机拍照图像,然后再运用软件依据图像灰阶差做进一步辨认处理.现在这个技术现已广泛推广到图像文字辨认中了,作为单位软件中得以推广,其间捷速图像辨认软件展开的最佳,在网上也有很多的网友问询捷速图像辨认软件如何运用.捷速图片转换成文字软件捷速因为自身的智能化程度高,很多的程序软件自身都给处理了,所以操作十分的简单,任何人都能够自立运用,下面我们就具体来看看. 1.翻开软件将需求辨认的