搜狗语音云开发入门--移动端轻松添加高大上的语音识别

1 简介

搜狗语音云基于自主开发、领先业内的语音技术,力求为广大开发者提供最优质的语音服务,开发者只需简单集成语音云控件, 就可以通过API调用搜狗语音云服务,获得搜狗强大的语音技术支持,更加专注于业务需求的开发。

2 提供的服务

  • 在线语音识别技术:

官方语:该技术让计算机可以“听懂”人类语音,通过机器将语音信号转变为相应的文本。

说白了:就是联网解析语音为文本。

  • 离线语音识别技术:

官方语:该技术通过本地离线语音包直接将语音输入识别转变为文字,从而代替云端服务器功能。

说白了:就是离线解析语音为文本,不用联网了。

  • 在线听歌识曲技术:

官方语:该技术基于搜狗自有技术,向广大中小开发者提供免费高效的听歌识曲服务。 从此查找歌名不必大费周章,只需录制提交音乐片段,由搜狗音乐云自动给出演唱者和歌曲名称。

说白了:就是找周杰伦的歌更不好找了。

  • 离线语音合成技术:

官方语:该技术可以让计算机将外部输入的文本信息转变为自然流畅的汉语口语,使电脑具有类似于人一样的说话能力, 离线语音合成则无需依赖网络即可在设备上合成出高音质的语音。

说白了:就是文本转语音。

3 如何使用

看着真是高大上啊,语音服务神秘难懂,现在只需简单调用,哪里不会调哪里,从此妈妈再也不用担心我的学习了,so easy!

3.1 使用步骤

使用步骤也不难。

首先,需要注册一个搜狗语音云账号。

其次,登陆后在左边的“应用信息”中选择要申请的服务:

如图所示,也可以进行“快速体验”。如果你是没有用过搜狗语音云服务的新手,推荐进入快速体验区进行快速体验,好处是不用搜狗审核就可以快速获取appId来调用服务,缺点就是服务次数受限制,不过一天500次一般也够用了:

点击右上角“我的应用”,就可以看到快速申请的appId了:

记录号id信息,服务中要用哦!

3.2 调用服务

这里该说说在客户端怎么调用了,以使用“快速体验”申请在“Android”平台上使用“语音识别”为例。

我们先来看看搜狗除了给了我们appId之外还给了我们什么...

第一个是调用的SDK包,第二个是调用说明。

将SDK包中,libs文件夹下的文件:

一股脑的放入你的Android工程的libs里面,并在工程中将sogou-srop.jar引入Build Path。

在你的布局页面里面放入一个按钮:

<span style="font-size:18px;"><RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:tools="http://schemas.android.com/tools"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    android:paddingBottom="@dimen/activity_vertical_margin"
    android:paddingLeft="@dimen/activity_horizontal_margin"
    android:paddingRight="@dimen/activity_horizontal_margin"
    android:paddingTop="@dimen/activity_vertical_margin"
    tools:context="com.example.testyuyin.MainActivity$PlaceholderFragment" >

    <Button
        android:id="@+id/button"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"
        android:text="我要说话!" />

</RelativeLayout></span>

在activity中的调用代码:

<span style="font-size:18px;">package com.example.testyuyin;

import java.util.List;

import android.app.Activity;
import android.app.AlertDialog;
import android.app.Fragment;
import android.content.DialogInterface;
import android.os.Bundle;
import android.view.LayoutInflater;
import android.view.Menu;
import android.view.MenuItem;
import android.view.View;
import android.view.View.OnClickListener;
import android.view.ViewGroup;
import android.widget.ArrayAdapter;
import android.widget.Button;
import android.widget.TextView;

import com.sogou.speech.listener.RecognizerListener;
import com.sogou.speech.ui.RecognizerDialog;

public class MainActivity extends Activity {

	public static RecognizerDialog dialog;

	@Override
	protected void onCreate(Bundle savedInstanceState) {
		super.onCreate(savedInstanceState);
		setContentView(R.layout.activity_main);

		if (savedInstanceState == null) {
			getFragmentManager().beginTransaction()
					.add(R.id.container, new PlaceholderFragment()).commit();
		}

	}

	@Override
	public boolean onCreateOptionsMenu(Menu menu) {

		// Inflate the menu; this adds items to the action bar if it is present.
		getMenuInflater().inflate(R.menu.main, menu);
		return true;
	}

	@Override
	public boolean onOptionsItemSelected(MenuItem item) {
		// Handle action bar item clicks here. The action bar will
		// automatically handle clicks on the Home/Up button, so long
		// as you specify a parent activity in AndroidManifest.xml.
		int id = item.getItemId();
		if (id == R.id.action_settings) {
			return true;
		}
		return super.onOptionsItemSelected(item);
	}

	/**
	 * A placeholder fragment containing a simple view.
	 */
	public static class PlaceholderFragment extends Fragment {

		public PlaceholderFragment() {
		}

		@Override
		public View onCreateView(LayoutInflater inflater, ViewGroup container,
				Bundle savedInstanceState) {
			View rootView = inflater.inflate(R.layout.fragment_main, container,
					false);

			Button button = (Button) rootView.findViewById(R.id.button);

			dialog = new RecognizerDialog(getActivity(), "appId","accessKey", true, false);
			dialog.setlistener(new RecognizerListener() {

				@Override
				public void onResults(List<List<String>> arg0) {
					for (List<String> stringList : arg0) {
						System.out.println("Yuyin------------------");
						for (String s : stringList) {
							System.out.println("Yuyin:" + s);
						}
					}

					String[] ss = new String[arg0.get(0).size()];
					for (int i = 0; i < ss.length; i++) {
						ss[i] = arg0.get(0).get(i);
					}

					new AlertDialog.Builder(getActivity())
					.setTitle("您说的是:")
					.setSingleChoiceItems(
							ss, 0,
									new DialogInterface.OnClickListener() {

								@Override
								public void onClick(
										DialogInterface dialog,
										int which) {
									dialog.dismiss();
								}
							}).setNegativeButton("取消", null).show();

				}

				@Override
				public void onQuitQuietly(int arg0) {
					// TODO Auto-generated method stub

				}

				@Override
				public void onPartResults(List<List<String>> arg0) {
					// TODO Auto-generated method stub

				}

				@Override
				public void onError(int arg0) {
					// TODO Auto-generated method stub

				}
			});

			button.setOnClickListener(new OnClickListener() {

				@Override
				public void onClick(View v) {
					dialog.show();
				}
			});

			return rootView;
		}
	}

}</span>

看到没?我们先定义了一个dialog,这是引用的搜狗语音的语音对话框。然后给dialog设置一个监听:RecognizerListener,它来监视用户的语音行为。注意“appId”和“accessKey”换成申请之后获取到的值。当然这里面要实现一些回调函数。

在函数onResults里面,我们可以定义获取了语音结果之后的行为。我们来看看onResults这个函数:

<span style="font-size:18px;">public void onResults(List<List<String>> arg0)</span>

可以看到它的函数是个两层list。也就是说,我们说话的时候,有可能说了好几句,而每句话,都有可能有不同的结果。比如你说了:

你好啊!

吃饭了吗!

其中,“你好啊”识别成的备选项可能有“你好啊”,“你好吗”,“你好啦”等。

“吃饭了吗”识别成的备选项可能有“吃饭了吗”,“吃饭了没”,“吃饭了啊”等。

所以,该函数参数的第一维list是说的不同的话,第二维是每句话的不同识别。明白了吧?明白了吗?

我们在例子中只识别第一句话,让屏幕弹出个对话框让我们选择。最后,让按钮与搜狗语音的dialog绑定,点击按钮弹出语音识别服务dialog。

3.3 客户端使用

直接上图:

点击“我要说话!”:

对着手机说“你好”:

选择你的本意,后台得到文本就可以为所欲为啦!很简单吧!更多的应用可以参考搜狗的示例程序及SDK文档。

时间: 2024-08-29 14:47:08

搜狗语音云开发入门--移动端轻松添加高大上的语音识别的相关文章

搜狗语音云开发入门(二)——使用离线语音识别服务

1 简介 之前在<搜狗语音云开发入门--移动端轻松添加高大上的语音识别>中介绍了使用搜狗语音云为客户端程序添加在线语音识别服务.在线语音服务需要联网使用,但是你不能指望用户拥有完美的环境,事实上大多数情况下用户的外围环境都会有所限制.有的时候没有Wi-Fi.没有流量,还想使用语音识别,如果你给用户一个提示"您没开流量..."只能说你的程序弱爆了.有条件情况下给用户提供完美的服务,没有条件创造条件服务质量依然完美,并且清风徐来了无痕迹,这才是完美应用的体现.你不是用户的亲戚朋

微信小程序云开发入门到发布上线

初始化项目 起步说明[非小白教程] 适合人群[建议快速看文档,对着写一遍] 看过官方文档,并简单的写过 起步教程 云开发文档 熟悉vue/es6 小程序注册[微信公众平台] 获取appid[微信公众平台-开发-开发设置] 新建小程序云开发项目 新建项目选择一个空目录,填入 AppID(使用云开发能力必须填写 AppID) 勾选创建 "小程序云开发 " 点击新建即可得到一个展示云开发基础能力的示例小程序. 该小程序与普通 QuickStart 小程序有以下不同需注意: 无游客模式.也不可

借助云开发实现小程序短信验证码的发送

最近在做小程序验证码登陆时,用到了短信发送验证码的需求,自己也研究了下,用云开发结合云函数来实现验证码短信发送还是很方便的. 老规矩,先看效果图 这是我调用腾讯云的短信平台发送的登陆验证码.核心代码其实只有下面这么多是不是感觉实现起来特别简单,怎么说呢,我们代码调用其实就这么几行,就可以实现短信的发送,但是腾讯云短信模板的审核比较繁琐,还有我们先去申请短信模板,短信模板审核通过后才可以使用.我们就先来说代码实现,然后再带大家简单的学习下短信模板的申请. 一,安装node类库 其实我们这里用到了云

基于科大讯飞语音云windows平台开发

前记: 前段时间公司没事干,突发奇想想做一个语音识别系统,看起来应该很简单的,但做起来却是各种问题,这个对电气毕业的我,却是挺为难的.谷姐已经离我们而去,感谢度娘,感谢CSDN各位大神,好歹也做的是那么回事了,虽然还是不好用,但基本功能实现了. 该软件使用VS2008C++/CLR开发,由于科大讯飞提供的是C的API接口,结果到这边就是各种不兼容,CLR是基于托管堆运行的,而这个API有是非托管堆的,使用了各种指针,原本打算使用C#来做,最后门外汉的我也没能做到C#和C指针完美结合,真怀恋单片机

入门移动端混合开发 实战京东 APP

第1章 课程介绍本章主要是向你介绍什么是混合开发,以及目前混合开发中的几种方案. 第2章 Hybrid 技术原理本章主要讲解 hybrid 技术原理与核心本质,让你对混合开发有更清楚的认识. 第3章 开发前的准备本章主要讲解核心代码开发前的准备知识,比如 Flex 布局.webpack 和 @vue/cli 的基础知识.scss 的基本应用和项目的初始化内容. 第4章 京东商城首页(上)本章主要使用 vue 开发商城首页,包括组件化思想.动态组件和异步组件的应用.axios的使用.swiper

HTML5端云整合:智能端应用与云端服务整合开发实战

课程简介:       作为Web与移动开发的新标准的HTML5/JavaScript/CSS3,已经纷纷被手机应该开发采用,这不但让UI极具弹性,而且也更容易与云计算整合. 本课程是云计算与智能终端时代的HTML5开发的一站式解决方案,专为企业内训和公开课制作,是完整覆盖HTML5时代开发人员所需使用的360度的技术解决方案,内容细致入微: 课程目标: 全面解析以HTML5+JavaScript来开发应用: 使用JavaScript开发云计算: 定制浏览器并具备开放html5浏览器的能力: 学

Cloudera Manager、CDH零基础入门、线路指导 http://www.aboutyun.com/thread-9219-1-1.html (出处: about云开发)

Cloudera Manager.CDH零基础入门.线路指导http://www.aboutyun.com/thread-9219-1-1.html(出处: about云开发) 问题导读:1.什么是cloudera CM .CDH?2.CDH.CM有哪些版本?3.CDH.CM有哪些安装方式?4.CDH如何开发? <ignore_js_op> 我们知道cloudera CDH 是为简化hadoop的安装,也对对hadoop做了一些封装.那么我们就像尝试学习cloudera.cloudera本质h

Web开发入门教程:Pycharm轻松创建Flask项目

Web开发入门教程:Pycharm轻松创建Flask项目 打开Pycharm的file,选择创建新的项目,然后弹出对话框,我们可以看到里面有很多的案例,Flask.Django等等,我们选择生成Flask的demo程序 选择创建之后一个简易的Flask项目就出现在我们眼前,第一个是入口程序,还有一个static的静态目录,templates是模板存放的位置 我们可以手动来启动这个Flask项目,但是这不是很理智的,在Pycharm上面有个run,我们可以选择run来启动Flask的服务,默认打开

云开发如何解决serverless对端的最后一公里问题

云开发如何解决serverless对端的最后一公里问题 @(技术分享) 前端圈从来不缺少新的技术.点子和话题,有些留下来了而有些则转瞬即逝.在决定一种新技术是否能够长久的所有因素里,最核心的必然是自身实力过硬能够经受住实践检验.而除此之外,这项技术所解决问题的广泛程度.受众群体规模等"非技术因素"也至关重要. 比如一经问世便话题性十足的React时至今日不论是自身还是其优秀的效仿者们都仍旧高歌猛进,高性能的vdom和高效率的数据驱动开发模式固然是其立足的基本,但React能够高度普及的