近期分享干货，使用python实现语音文件的特征提取方法

Python编程语言无疑是人工智能最重要的语言之一，但是其中语音识别是当前人工智能比较热门的方向，百度的小度机器人、阿里的天猫精灵等其他各大公司都推出了各自的语音助手机器人，其识别算法主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。但训练这些模型的第一步就是将音频文件数据化，提取当中的语音特征。

MP3文件转化为WAV文件

录制音频文件的软件大多数都是以mp3格式输出的，但mp3格式文件对语音的压缩比例较重，因此首先利用ffmpeg将转化为wav原始文件有利于语音特征的提取。其转化代码如下：

读取WAV语音文件，对语音进行采样

利用wave库对语音文件进行采样。

代码如下：

绘制声波折线图与频谱图

代码如下：

首先利用百度AI开发平台的语音合API生成的MP3文件进行上述过程的结果。

声波折线图

频谱图

全部代码

以上这篇就是小编分享的使用python实现语音文件的特征提取方法。

原文地址：http://blog.51cto.com/14167862/2349432

时间： 2024-10-01 04:32:15

近期分享干货，使用python实现语音文件的特征提取方法的相关文章

用python读取word文件里的表格信息【华为云技术分享】

在企查查查询企业信息的时候,得到了一些word文件,里面有些控股企业的数据放在表格里,需要我们将其提取出来. word文件看起来很复杂,不方便进行结构化.实际上,一个word文档中大概有这么几种类型的内容:paragraph(段落),table(表格),character(字符).我现在要解析的word文档中,基本都是段落和表格,本文主要来讲一下如何从word中解析出表格,并将表格信息进行结构化. 要想使用python解析word文件,我们可以使用包docx,首先我们需要安装它. 安装完成后,我

Python读取Yaml文件

近期看到好多使用Yaml文件做为配置文件或者数据文件的工程,随即也研究了下,发现Yaml有几个优点:可读性好.和脚本语言的交互性好(确实非常好).使用实现语言的数据类型.有一个一致的数据模型.易于实现. 既然有这么多好处,为什么不用呢,随后开始研究在Python中怎么读取Yaml文件,下面我们来看下: 1.首先需要下载Python的yaml库PyYAML,下载地址:http://pyyaml.org/,安装过程就省略...... 2.建立一个.py文件 3.import yaml 4.f = o

《码农周刊》干货精选--Python篇（转）

原文:http://baoz.me/446252 码农周刊如何让 Python 代码运行得更快? 作者给出了 18 条 Python 代码性能优化小贴士,简单明了,拿来即用. http://infiniteloop.in/blog/quick-python-performance-optimization-part-i/ Python 学习资源列表 (kirang89) 海量 Python 学习资源列表,涉及 Python 学习的方方面面. https://github.com/kirang8

python学习之-文件和对象

文件和对象文件对象不仅可以用来访问普通的磁盘文件,还能够来访问普通的磁盘文件,也可以访问任何其他类型抽象层面的"文件".内建函数 open() 返回一个文件对象,对该文件进行后续相关的操作都要用到它.文件内建函数 open() 以及 file() 提供了初始化输入/输出(I/O)操作的通用接口.open() 内建函数成功打开文件后会返回一个文件对象,否则引发一个错误.当操作失败,会产生一个IOERROR异常.内建函数 open() 的基本语法:file_object = open(fi

【python-ini】python读写ini文件

本文实例讲述了Python读写ini文件的方法.分享给大家供大家参考.具体如下: 比如有一个文件update.ini,里面有这些内容: 1 2 3 4 5 6 7 8 [ZIP] EngineVersion=0 DATVersion=5127 FileName=dat-5127.zip FilePath=/pub/antivirus/datfiles/4.x/ FileSize=13481555 Checksum=6037,021E MD5=aaeb519d3f276b810d46642d782

Python基础入门-文件读写

在python中文件的读写操作应该的十分广泛.比如,我们经常会读取txt获取一些信息,用来参数化操作.当热不局限于这些,关于文件读写方面的知识有很多,说一天可能都说不完,但是我们今天呢?主要跟大家分享的是python的文件读写中一些比较实用.我们经常用的知识.来开始表演吧~~~~ 在python如如何创建一个文件呢?我们可以使用open()函数,这个函数里面有很多的参数,看一下它的基本机构: open(name[, mode[, buffering]]) name : 一个包含了你要访问的文件名

电脑中识别语音文件的操作方法

有时候我们的电脑中保存了一些重要的录音,需要识别语音文件转换成文字,那这个时候应该如何去操作呢?下面小编就来为大家分享一种简单的方法,快来学习一下吧! 参考工具:迅捷OCR文字识别软件操作步骤: 1:首先将需要识别的语言文件整理到电脑桌面,方便待会识别,接着将OCR文字识别软件打开,选择语音识别板块. 2:进入语音识别操作界面后,点击页面中心的地方将保存在电脑桌面的语音文件添加进来,注意支持识别的文件格式哦! 3:语音文件添加完成后会跳转到另一个页面,将语音语言更改为中文. 4:为了方便识别后

文字转语音文件的两种方法

文件转语音文件的两种方法.小伙伴们在日常的工作.学习或是生活当中,是否遇到过以下这种情况.在工作中每天要阅读大量文件资料,在学习中每天要阅读各种课文,在生活中也会观看各种小说.但是长时间的用眼阅读,就会使大家的眼睛感到疲劳,十分的酸痛,可是又需要将剩下的内容阅读完.在这种时候就变得十分无奈,大家就会像如何能将文字转换为语音就好了.那么今天小编就将教给大家如何将文字转换为语音文件. 1.在开始转换前,需要小伙伴们先打开电脑里的浏览器,并输入搜索文字转语音在线转换,然后点击进入搜索到得页面当中. 2

python读取wav文件并播放[pyaudio/wave]

#!/usr/bin/python # encoding:utf-8 import pyaudio import wave CHUNK = 1024 # 从目录中读取语音 wf = wave.open('mic4.wav', 'rb') # read data data = wf.readframes(CHUNK) # 创建播放器 p = pyaudio.PyAudio() # 获得语音文件的各个参数 FORMAT = p.get_format_from_width(wf.getsampwidt

猜你喜欢

C++文件输入输出

#include <iostream> //有些系统里面可以省略此头文件 #include <fstream> #include <string> int main ...

array=nil 和 Array=[[NSMutableArray alloc]init]; 的区别

情况1: array=nil; [_PayArray addObject:BillDetail]; 此时array还是nil:因为array没有分配地址应该. 情况2: Array=[[NSMutab ...

[转]servlet配置中init-param

需要初始化的参数比如你的servlet里面有个属性为int total=0默认是0,你想让他初始时50则用init-param 给他赋值 init-param面对应的参数名和值,是给servlet在初 ...

异常的基本概念

目标: 1)异常基本概念, 2)处理异常基本格式 3)异常继承结构 4)掌握JAVA异常处理机制. 具体内容异常:导致程序中断的一种指令流. public class ExceptionDemo01 ...

1.ROS启动小乌龟

启动turtlesim 在三个不同的终端中分别执行如下三个指令 roscore rosrun turtlesim turtlesim_node rosrun turtlesim turtle_tele ...

mysql float double 类型

1.float类型 float列类型默认长度查不到结果.必须指定精度. 比方 num float, insert into table (num) values (0.12); select * fr ...

网站被镜像了怎么办

http://passport.baidu.com/?business&un=%E5%93%88%E5%AF%86%E5%8C%85%E5%A4%9C%E7%9A%84%E5%B0%8F%E5 ...

《黑马程序员》C语言中的基本数据类型 (C语言)

C语言中基本数据类型共分为三类:分别为整型.浮点型.和字符型. 整型(int): 整型数据包含了所有的整数,例如:20.15.-19.987等浮点型(float\double): float:单精度 ...

杭电 1108 最小公倍数

http://acm.hdu.edu.cn/showproblem.php?pid=1108 最小公倍数 Time Limit: 2000/1000 MS (Java/Others) Memor ...

Linux System Programming 学习笔记(八) 文件和目录管理

1. 文件和元数据每个文件都是通过inode引用,每个inode索引节点都具有文件系统中唯一的inode number 一个inode索引节点是存储在Linux文件系统的磁盘介质上的物理对象,也是L ...

bootstrap中标签和徽章<新闻后面的new hot等>

直接看效果吧! 代码: <div class="container"> <h2>最近气温将会大幅上升<span class="label l ...

RabbitMQ使用详解

RabbitMQ中Exchange的类型类型有4种,direct,fanout,topic,headers.其中headers不常用,本篇不做介绍,其他三种类型,会做详细介绍. 那么这些类型是什么意 ...

SQL中遇到多条相同内容只取一条的实现

例如出现BID为1673的两条重复数据,要第一条 select * from(select no=row_number() over(partition by Bid order by getdate ...

认识大数据

大数据是具有海量.高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力.洞察发现力和流程优化能力. 从样本数据统计到全量数据统计就是大数据的一个例子. 面对超大规模的数据存储量,依靠单台数据库 ...

3. 戏说VHDL之入门游戏一：流水灯

一．流水灯 1.1流水灯原理流水灯是每个学电子的入门“游戏” ,示意图如图1,其原理极其简单,但是可玩性却极强,可以就8个LED写出不同花样的程序.在1.2中我们列出两个不同思路的代码作为VH ...

日渐感觉测试的重要性,不仅保证产品的质量,对以后重构提供保障 Karma的安装就不说了 npm install -g karma-cli npm install -g karma 配置文件应放在根目录 ...

onTouchEvent

新建"MyView"类 package onTouchEvent; import android.content.Context; import android.graphics. ...

Hive 对列通配查询

本文记录hive列通配查询相关使用,通常写hql的时候大家经常在where过滤条件中使用通配,其实在hive中select的时候对列同样可以使用正则通配. 使用场景:表中列比较多,且有规律的名字(co ...

Classification of text documents: using a MLComp dataset

注:原文代码链接http://scikit-learn.org/stable/auto_examples/text/mlcomp_sparse_document_classification.html ...

Mantis去掉登录界面的“注册一个新账号”链接

Mantis1.1.2主界面提供了新账号注册功能,但是只能注册默认权限的帐号.不是很实用,那就干脆去掉吧. (1) 打开Mantis目录下的login_page.php和lost_pwd_page.p ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.