过零率

在zcr01的sample里,设定frame的时间戳为每个frame的中心,

frameTime=((0:frameNum-1)*(frameSize-overlap)+0.5*frameSize)/fs;

method:

  1.找出每个frame的起始界(0:frameNum-1)*(frameSize-overlap)

  2.由起始边界加每个frame的一半,即为中心(0:frameNum-1)*(frameSize-overlap)+0.5*frameSize

  3.找到各帧中心的帧index,除以fs即为各中心对应的时间frameTime=((0:frameNum-1)*(frameSize-overlap)+0.5*frameSize)/fs;

在计算各帧过零率时,应减去各帧的均值 RojerJang称为mean justification

frameMat(:,i)=frameMat(:,i)-mean(frameMat(:,i)); % mean justification

画zcr的图时,横坐标是上边求出来的各帧的中心时间,纵坐标是对应帧的zcr

subplot(2,1,2); plot(frameTime, zcr, ‘.-‘);

时间: 2024-10-12 00:49:06

过零率的相关文章

短时平均过零率

1.  定义    在离散时间语音信号情况下,如果相邻的采样具有不同的代数符号就称为发生了过零.单位时间内过零的次数就称为过零率.短时平均过零率的定义为  目前我还没弄明白,把语音信号截断为什么要卷积一个窗函数,为什么不是直接乘? 考虑到w(n-m)的非零值范围为n-m≥0,即m≤n,以及n-m≤N-1,故m≥n-N+1,因此短时平均过零率可以改写为: 下面是matlab程序 clear all [signal,fs,bit] = wavread('1.wav'); subplot(3,1,1)

自适应含噪信号过零率算法

本文讨论的是实际使用过程中计算过零率的一种自适应方法.过零率常用于语音检测识别中,一般叫短时过零率更贴切些(指一段短时平稳信号才能计算过零率),简单有效,近期亦打算将这个简单的概念用于识别脚步声和卡车声(近似短时平稳).过零率的定义计算一般通过下面的表达式描述: 过零率是对频率从时域进行的一种简单的度量,一般情况下,过零率越大频率近似越高,反正亦然,相关推倒可参考相关文献. 自然信号由于电路.环境引入的噪声会在0水平位置波动,直接按上式计算过零率,严重影响识别效果.因此,本文在计算过零率时,对信

基于AR谱特征的声目标识别

本文第一部分先解释AR谱,但并不会给出太多的细节,第二部分介绍几种常见的语音中的特征,有些在之前的博文中已经用过,诸如过零率.第三部分给出实际操作的过程及识别的效果.本文的目标是通过对DSP采集的声音信号提取特征,识别卡车和飞机. 转载请注明出处: xiahouzuoxin.github.io 关于AR谱 AR模型全称Auto-Regression Model,是通过参数计算信号功率谱的一种方法.在Matlab中计算AR谱很简单:假设有一个1024个点的车辆信号x, y = pyulear(x,

DTW

DTW主要是应用在孤立词识别的算法,用来识别一些特定的指令比较好用,这个算法是基于DP(动态规划)的算法基础上发展而来的.这里介绍语音识别就先介绍下语音识别的框架,首先我们要有一个比对的模版声音,然后需要去截取其里面包含真正属于语音的部分,这个要采用一个叫做vad(voice activedetection)语音活动检测的算法,而在vad中间我们最常使用双门限端点检测这种方法,如图所示,我们采用vad判断语音的开始和结束,判断方法就是通过音量的大小做一个阈值判定,在时域上很简单就能判定. 图.s

数字语音信号处理学习笔记——语音信号的短时时域分析(1)

3.1 概述 语音信号是一种非平稳的时变信号,它携带着各种信息.在语音编码.语音合成.语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息.一般而言语音处理的目的有两种:一种是对语音信号进行分析,提取特征参数,用于后续处理:另一种是加工语音信号,例如在语音增强中对含噪语音进行背景噪声抑制,以获得相对"干净"的语音:在语音合成方中需要对分段语音进行拼接平滑,获得主观音质较高的合成语音,这方面的应用同样是建立在分析并提取语音信号信息的基础上的.总之,语音信号分析的目的就在于方便有效

常用有话帧检测技术(VAD)

作者:桂. 时间:2017-05-31  17:43:22 链接:http://www.cnblogs.com/xingshansi/p/6925355.html 前言 总结一下基本的有话帧检测(Voice activity detection, VAD)技术. 一.双门限 这是一种Boosting的思路,即:两个弱分类器可以组合更强的分类器,依次类推,三.四门限其实都可.每一种门限对应一种判决准则. 基本的双门限:短时能量+短时过零率,其原理是元音能量较大,用短时平均能量检测,辅音频率较高,用

语音信号实时采集与处理

<一>基于MATLAB的语音信号采集和分析系统的可视化设计 论文摘要:设计和开发了一种基于MATLAB的语音采集与分析的可视化系统,该系统通过Realtek Ac97型声卡和MATLAB的数据采集工具箱低成本地实现了语音信号的实时采集,并利用 MATLAB 强大的数值计算和信号处理功能高精度地完成了语音信号的分析工作.系统还使用 MATLAB 的图形用户界面设计工具进行了优化,通过简单的对话框和菜单操作取代了复杂的程序修改和调试过程,使得系统的使用更加方便灵活. 论文理解:系统主要包括语音采集

离线版-端点检测代码重写

根据对双门限的理解和修改,重写了一个离线版端点检测. function [st,en]=VAD(x, fs) x=double(x); x=x/max(abs(x)); framelen= floor(fs*40/1000);% frameinc= floor(fs*10/1000);% y=enframe(x,framelen,frameinc); %计算短时间能量 amp=sum(abs(y),2); %开始端点检测 tmp1=enframe(x(1:length(x)-1),framele

【转】智能音箱技术概览

转自:http://blog.csdn.net/jackytintin/article/details/62040823 对于没有使用过智能音箱的读者,可以观看 Echo 的官方广告,直观地体验下智能音箱. 目前的智能音箱多基于语音控制,其基本交互流程可以用图1 概括:1)用户通过自然语言向音箱提出服务请求或问题 2)音箱拾取用户声 音(音箱本地完成)并分析(一般在服务器端完成)3)音箱通过语言播报(音箱端)和 APP 推送(关联的手机等)对用户的请求进行反馈. 图1. 智能音箱基本交互方式 智