近期分享干货,使用python实现语音文件的特征提取方法

Python编程语言无疑是人工智能最重要的语言之一,但是其中语音识别是当前人工智能比较热门的方向,百度的小度机器人、阿里的天猫精灵等其他各大公司都推出了各自的语音助手机器人,其识别算法主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。但训练这些模型的第一步就是将音频文件数据化,提取当中的语音特征。

MP3文件转化为WAV文件

录制音频文件的软件大多数都是以mp3格式输出的,但mp3格式文件对语音的压缩比例较重,因此首先利用ffmpeg将转化为wav原始文件有利于语音特征的提取。其转化代码如下:

读取WAV语音文件,对语音进行采样

利用wave库对语音文件进行采样。

代码如下:

绘制声波折线图与频谱图

代码如下:

首先利用百度AI开发平台的语音合API生成的MP3文件进行上述过程的结果。

声波折线图

频谱图

全部代码



以上这篇就是小编分享的使用python实现语音文件的特征提取方法。

原文地址:http://blog.51cto.com/14167862/2349432

时间: 2024-10-01 04:32:15

近期分享干货,使用python实现语音文件的特征提取方法的相关文章

用python读取word文件里的表格信息【华为云技术分享】

在企查查查询企业信息的时候,得到了一些word文件,里面有些控股企业的数据放在表格里,需要我们将其提取出来. word文件看起来很复杂,不方便进行结构化.实际上,一个word文档中大概有这么几种类型的内容:paragraph(段落),table(表格),character(字符).我现在要解析的word文档中,基本都是段落和表格,本文主要来讲一下如何从word中解析出表格,并将表格信息进行结构化. 要想使用python解析word文件,我们可以使用包docx,首先我们需要安装它. 安装完成后,我

Python读取Yaml文件

近期看到好多使用Yaml文件做为配置文件或者数据文件的工程,随即也研究了下,发现Yaml有几个优点:可读性好.和脚本语言的交互性好(确实非常好).使用实现语言的数据类型.有一个一致的数据模型.易于实现. 既然有这么多好处,为什么不用呢,随后开始研究在Python中怎么读取Yaml文件,下面我们来看下: 1.首先需要下载Python的yaml库PyYAML,下载地址:http://pyyaml.org/,安装过程就省略...... 2.建立一个.py文件 3.import yaml 4.f = o

《码农周刊》干货精选--Python篇(转)

原文:http://baoz.me/446252 码农周刊 如何让 Python 代码运行得更快? 作者给出了 18 条 Python 代码性能优化小贴士,简单明了,拿来即用. http://infiniteloop.in/blog/quick-python-performance-optimization-part-i/ Python 学习资源列表 (kirang89) 海量 Python 学习资源列表,涉及 Python 学习的方方面面. https://github.com/kirang8

python学习之-文件和对象

文件和对象文件对象不仅可以用来访问普通的磁盘文件,还能够来访问普通的磁盘文件,也可以访问任何其他类型抽象层面的"文件".内建函数 open() 返回一个文件对象,对该文件进行后续相关的操作都要用到它.文件内建函数 open() 以及 file() 提供了初始化输入/输出(I/O)操作的通用接口.open() 内建函数成功打开文件后会返回一个文件对象,否则引发一个错误.当操作失败,会产生一个IOERROR异常.内建函数 open() 的基本语法:file_object = open(fi

【python-ini】python读写ini文件

本文实例讲述了Python读写ini文件的方法.分享给大家供大家参考.具体如下: 比如有一个文件update.ini,里面有这些内容: 1 2 3 4 5 6 7 8 [ZIP] EngineVersion=0 DATVersion=5127 FileName=dat-5127.zip FilePath=/pub/antivirus/datfiles/4.x/ FileSize=13481555 Checksum=6037,021E MD5=aaeb519d3f276b810d46642d782

Python基础入门-文件读写

在python中文件的读写操作应该的十分广泛.比如,我们经常会读取txt获取一些信息,用来参数化操作.当热不局限于这些,关于文件读写方面的知识有很多,说一天可能都说不完,但是我们今天呢?主要跟大家分享的是python的文件读写中一些比较实用.我们经常用的知识.来开始表演吧~~~~ 在python如如何创建一个文件呢?我们可以使用open()函数,这个函数里面有很多的参数,看一下它的基本机构: open(name[, mode[, buffering]]) name : 一个包含了你要访问的文件名

电脑中识别语音文件的操作方法

有时候我们的电脑中保存了一些重要的录音,需要识别语音文件转换成文字,那这个时候应该如何去操作呢?下面小编就来为大家分享一种简单的方法,快来学习一下吧! 参考工具:迅捷OCR文字识别软件 操作步骤: 1:首先将需要识别的语言文件整理到电脑桌面,方便待会识别,接着将OCR文字识别软件打开,选择语音识别板块. 2:进入语音识别操作界面后,点击页面中心的地方将保存在电脑桌面的语音文件添加进来,注意支持识别的文件格式哦! 3:语音文件添加完成后会跳转到另一个页面,将语音语言更改为中文. 4:为了方便识别后

文字转语音文件的两种方法

文件转语音文件的两种方法.小伙伴们在日常的工作.学习或是生活当中,是否遇到过以下这种情况.在工作中每天要阅读大量文件资料,在学习中每天要阅读各种课文,在生活中也会观看各种小说.但是长时间的用眼阅读,就会使大家的眼睛感到疲劳,十分的酸痛,可是又需要将剩下的内容阅读完.在这种时候就变得十分无奈,大家就会像如何能将文字转换为语音就好了.那么今天小编就将教给大家如何将文字转换为语音文件. 1.在开始转换前,需要小伙伴们先打开电脑里的浏览器,并输入搜索文字转语音在线转换,然后点击进入搜索到得页面当中. 2

python读取wav文件并播放[pyaudio/wave]

#!/usr/bin/python # encoding:utf-8 import pyaudio import wave CHUNK = 1024 # 从目录中读取语音 wf = wave.open('mic4.wav', 'rb') # read data data = wf.readframes(CHUNK) # 创建播放器 p = pyaudio.PyAudio() # 获得语音文件的各个参数 FORMAT = p.get_format_from_width(wf.getsampwidt