绘制音频的波形图

有时候,为了直观地分析音频的特征,画几个图是必不可少的。

当然,读者可以把音频文件拉到Adobe Audition或其它音频分析软件中,再使用它绘制出来的特征图。

那有没有办法自己写代码来绘制,并做一些灵活的控制呢?

本文介绍通过python的matplotlib.pyplot来绘制波形图。

pyplot是一个强大的绘图库,小程这里用来绘制波形,也只是牛刀小试。

小程先用自己的话,解释一些本文会提到的基础概念。

声道数,也叫通道数,这在采集声音(录制)时就引入的概念,可以理解为用几个通道去录制声音。比如一个人唱歌时,可以在他的左前方跟右前方(与声源同距离同方位),分别放一个通道去录制,这时两个通道录到的数据很可能是接近或相同的,如果距离或方位不同,则录制到的音频就会有差别。为了真实地还原现场,可以考虑多个通道进行录制,但也需要考虑录制后播放时是否支持多通道(否则还是达不到效果)。一般来说,单声道或双声道的音频文件还是比较常见的。

采样率,针对一个通道而言,也就是1秒钟一个通道采集的样本个数,各个通道各自采集。一般来说,常见的音频文件的采样率都比较高,比如44100Hz、32000Hz之类。读者在看波形图时,看到“一团一团”的波形,这跟采样率很大有关,比如一秒内采集到4万多个样本,然后要在一秒的刻度上反映出这4万个点的振动情况,都聚集在一起了。

位深,也叫量化精度、位宽,即对一个样本的值用多少bit去表示它,用的bit越多,能表示的值就越多,也就越能接近样本的原值。比如极端一点,用2个bit去表示,那能表示的值就只能是0、1、2、3,那不管样本的值是多少,最终都会就近地选择这4个值中的一个,这样的话,所有样本在量化后的层次就很少(就4个值,对应电平)。如果用16bit、24bit或更多的bit去量化样本的值,层次就多得多,最终听起来会更细腻,当然存储的体积也更大。

帧数,也叫样本个数。对于“总帧数”要根据上下文来判断,有可能是一个通道(声道)的总帧数,也有可能是所有通道的总帧数。对于样本个数,是可以通过文件的大小与位深计算出来的。比如,对于一个pcm文件,已经知道文件大小是fs,采样精度为w个字节(比如2个字节),那所有通道的样本个数是(fs / w),如果是n个通道,则一个通道的样本个数是(fs / w / n)。

波形图,也叫振幅图,是音频的振幅(或能量)这个维度的图形表达。对于波形图,横坐标是时间,纵坐标一般有两种表示方式,一种方式是用dB来表示(就是分贝,读者可以留意后面的截图),audition就用dB来表示;另一种方式是用[-1, 1]这个范围来表示,这种方式并不关心具体的能量值,只关心振幅的趋势,所以用归一化的思路固定一个变化的范围就可以了。

介绍完这些枯燥的概念后,小程先摆一个绘制波形的代码,再在后面做一些解释。

import wave
import matplotlib
matplotlib.use(‘TkAgg‘)
import matplotlib.pyplot as plt
import os, sys
import audioread
import numpy as np

def decode2wav(srcname, outname):
    f = audioread.audio_open(filename)
    nsample = 0
    for buf in f:
        nsample += 1
    f.close()

    with audioread.audio_open(filename) as f:
        print("input file: channels=%d, samplerate=%d, duration=%d" % (f.channels, f.samplerate, f.duration))
        channels = f.channels
        samplewidth = 2
        samplerate = f.samplerate
        compresstype = "NONE"
        compressname = "not compressed"
        outwav = wave.open(outname, ‘wb‘)
        outwav.setparams((channels, samplewidth, samplerate, nsample, compresstype, compressname))
        for buf in f:
            outwav.writeframes(buf)
        outwav.close()

def pcm2wav(srcname, outname, channels, samplewidth, samplerate):
    fs = os.path.getsize(srcname)
    nsample = fs / samplewidth
    outwav = wave.open(outname, ‘wb‘)
    outwav.setparams((channels, samplewidth, samplerate, nsample, "NONE", "not cmopressed"))
    fsrc = open(srcname, ‘rb‘)
    outwav.writeframes(fsrc.read())
    fsrc.close()
    outwav.close()

if __name__ == ‘__main__‘:
    filename = sys.argv[1]
    filename = os.path.abspath(os.path.expanduser(filename))
    if not os.path.exists(filename):
        print("input file not found, then exit")
        exit(1)

    path, ext = os.path.splitext(filename)
    wavpath = path + ".wav"
    if ext != ‘.wav‘:
        if ext == ".pcm":
            if len(sys.argv) < 5:
                print("when input pcm, parameters should be [pcmfilename, channelcount, samplewidth_byte, samplerate]")
                exit(1)
            chcout = int(sys.argv[2])
            bitwidth = int(sys.argv[3])
            samplerate = int(sys.argv[4])
            pcm2wav(filename, wavpath, chcout, bitwidth, samplerate)
        else:
            decode2wav(filename, wavpath)
    wav = wave.open(wavpath, ‘rb‘)
    channels, samplewidth, samplerate, nframe = wav.getparams()[:4]
    print("in wav file params: (%d:%d:%d:%d)" % (channels, samplewidth, samplerate, nframe))
    audiobyte = wav.readframes(nframe)
    wav.close()
    time = np.arange(0, nframe) * (1.0 / samplerate)
    numdata = np.fromstring(audiobyte, dtype=np.int16)
    numdata = numdata * 1.0 / max(abs(numdata))
    numdata = np.reshape(numdata, (nframe, channels))
    # plt.figure()
    for i in range(channels):
        plt.subplot(channels*2-1, 1, i*2+1)
        plt.plot(time, numdata[:, i])
        plt.xlabel("times(s)")
        plt.ylabel("amplitude")
        plt.title("wave - channel %d" % (i+1))
    plt.show()

大体的思路是先把音频文件解码出pcm数据并写成wav文件,再使用pyplot对wav文件进行绘制(实际只需要绘制样本归一化后的值)。

小程先展示下执行的效果。

可以这样执行这个脚本,分别输入wav、mp3、pcm与flac文件:



运行后可以得到相应的波形图,这里提供几个截图。

*. 单声道的波形:

对应,audition分析到的波形是这样的:

*. 双声道的波形:

对应,audition分析到的波形是这样的:

然后,小程对关键的代码做一些解释,请参考下面的截图。



其中,pyplot的函数subplot(),作用是画子图。subplot(rownum, clonum, curnum),前两个参数指定画多少行多少列,最后一个参数是当前子图的编号,按从左往右,从上往下的顺序进行编号。
比如:
plt.subplot(2, 1, 1) -- 画两行一列(两个子图),在第一个子图绘制。

numpy的函数reshape(),作用是给原数组一个新的形状,也就是重新定义行列数,但不改变数组的值。
比如:
numdata = np.reshape(numdata, (nframe, channels)) -- 把numdata改为nframe行,channels列。

至此,通过pyplot绘制波形图的实现介绍完毕了。



总结一下,本文介绍了如何通过pyplot来绘制音频波形图的办法,讲解了一些概念,也解释了代码上的实现。从代码实现以及概念的理解的角度来说,难度系数为3。

原文地址:http://blog.51cto.com/13136504/2090419

时间: 2024-08-27 10:19:08

绘制音频的波形图的相关文章

音频特征(1):mfcc提取

除了调用FFmpeg来做多媒体开发,另一方面,是对音频特征进行研究.有很多具体的音频特征,比如频率.振幅.节拍(bpm).过零率.短时能量.MFCC等,在很多时候,提取这些特征是进一步分析音频的基础. 如果你想对音频进行一个分类,比如分出快慢歌.分出爵士跟hiphop.分出钢琴与吉他.分出男高音与鸟叫声,等等,这时,基本上,你离不开音频特征的提取.在众多的音频特征中,频率与MFCC,是经常用到的两个特征. 本文主要介绍MFCC的概念,以及如何提取MFCC. 这里先回顾一下频率的概念,然后再介绍M

Python解析Wav文件并绘制波形的方法

资源下载 #本文PDF版下载 Python解析Wav文件并绘制波形的方法 #本文代码下载 Wav波形绘图代码 #本文实例音频文件night.wav下载 音频文件下载 (石进-夜的钢琴曲) 前言 在现在繁忙的生活中,我们经常会听些歌来放松一下自己,我们经常会从各种播放软件中听自己喜欢的歌,并且往往我们会下载一部分歌曲,而现在音频的种类也相当繁多,像是Wav,Mp3,FLAC,AAC等等很多格式,最近由于需要做一个能够分析Wav格式音频的波形来取得一些数据比如获取人录音时是否说完等等用途.本周先对解

用 Web 实现一个简易的音频编辑器

前言 市面上,音频编辑软件非常多,比如 cubase.sonar 等等.虽然它们功能强大,但是在 Web 上的应用却显得心有余而力不足.因为 Web 应用的大多数资源都是存放在网络服务器中的,用 cubase 这些软件,首先要把音频文件下载下来,修改完之后再上传到服务器,最后还要作更新操作,操作效率极其低下.如果能让音频直接在 Web 端进行编辑并更新到服务器,则可以大大提高运营人员的工作效率.下面就为大家介绍一下如何运用 Web 技术实现高性能的音频编辑器. 本篇文章总共分为 3 章: 第 1

阿里云移动端播放器高级功能---截图和音频波形

基本介绍如果用户对视频播放中的某一帧画面特别感兴趣,可以使用截图功能将这一帧视频保存起来.另外有一种场景想知道是否有声音,或者想感知声音的大小震动频率等,可以通过显示一个声音的波形来形象的表示.如下图所示:那么播放器提供了类似的方法可以让用户有办法去实现音频波形这个功能.那么这种通常在音乐播放器中比较常见,或者在直播场景中来标识对方讲话是否有声音等,有一定的应用场景. 视频截图实现接口iOS接口如下: /** 功能:截取当前正在播放图像 /-(UIImage) snapshot;Android接

Android进阶系列:八、自定义View之音频抖动动效

自定义动画效果--音频抖动效果 1.绘制一个矩形: 想要绘制一个矩形,继承View,并重写onDraw方法即可.复杂一点还可以重写onMeasure方法和onLayout方法进行大小测量和位置测量.但本文不打算写那么复杂的view,故只需要重写一个onDraw方法即可: private RectF rectF = new RectF();//绘制矩形 private float lineWidth = 50; private Paint paint = new Paint(); @Overrid

我的Android进阶之旅------&gt;Android实现音乐示波器、均衡器、重低音和音场功能

本实例来自于<疯狂Android讲义>,要实现具体的功能,需要了解以下API: MediaPlayer  媒体播放器 Visualizer 频谱 Equalizer 均衡器 BassBoost 重低音控制器 PresetReverb 预设音场控制器 Paint 绘图 来看下效果示意图,如下所示 竖状波形图 块状波形图 曲线波形图 调节均衡器.重低音 选择音场 下面来看具体的实现代码 MediaPlayerTest.java package com.oyp.media; import java.

【转】Python处理wave文件

#本文PDF版下载 Python解析Wav文件并绘制波形的方法 #本文代码下载 Wav波形绘图代码 #本文实例音频文件night.wav下载 音频文件下载 (石进-夜的钢琴曲) 前言 在现在繁忙的生活中,我们经常会听些歌来放松一下自己,我们经常会从各种播放软件中听自己喜欢的歌,并且往往我们会下载一部分歌曲,而现在音频的种类也相当繁多,像是Wav,Mp3,FLAC,AAC等等很多格式,最近由于需要做一个能够分析Wav格式音频的波形来取得一些数据比如获取人录音时是否说完等等用途.本周先对解析Wav并

Eclipse SWT开发教程以及一个连连看游戏的代码实现下载

原创整理不易,转载请标明出处:Eclipse SWT开发教程以及一个连连看游戏的代码实现下载 代码下载地址:http://www.zuidaima.com/share/1772672482675712.htm 我在前面讲过:如果讲GUI编程一味只讲各个控件的使用方法,那么纯粹是浪费大家时间,如果出书,那绝对是骗钱的.所以我并不会详细地讲解SWT各个控件的具体使用方法.然而的众所周知,Eclipse的UI界面是建立在SWT基础之上的,如果一字不提SWT,似乎也不大可能.SWT是一个优秀的GUI编程

iOS 进度条、加载、安装动画 —— HERO博客

iOS 进度条.加载.安装动画简单实现. 首先看一下效果图: 下面贴上代码: 控制器ViewController: #import <UIKit/UIKit.h> @interface ViewController : UIViewController @end /*** ---------------分割线--------------- ***/ #import "ViewController.h" #import "HWWaveView.h" #im