自由操控声音-相位声码器-变速篇(一)

比较古董的声码器:LPC声码器,相位声码器

LPC声码器就是用全极点模型来表示浊音,近似清音,根据最小平方误差最小化原则,得到该模型的一组参数,就是LPC系数,对系数量化编码,可以大幅压缩数据量;从时域来分析,就是用过去的一组样本点来预测现在的样本点。

从短时傅里叶变换和逆变换可以推导出,一个信号x(n)通过一组滤波器组,在满足一定条件下,这些滤波后的各个频段信号累积起来,可以还原x(n)。

这组滤波器其实就是由窗函数(低通滤波器)调制到不同的频率段上,构成一组带通滤波器。滤波器组的N个通道的中心频率就是离散频率的取样值w(k) = 2pi/N*k.

输入信号通过该组滤波器组,对应于相位声码器的分析过程,每个通道的输出可以看做是复正弦波。这组正弦波经过叠加或者其它处理(例如变速或者变调),最后还原成初始信号或者合成想要的信号。它也是正弦模型的基本思想。

传统相位声码器变速的一种方法是建立在OLA算法的基础上,考虑到了相位,对相位进行重建,比OLA语音质量要好。

                                         

OLA变速                                                                                     相位声码器变速

                                         

原始音频:                      http://pan.baidu.com/s/1i3437FJ              test.wav

OLA变速0.7:                 http://pan.baidu.com/s/1i3437FJ              faster.wav

相位声码器变速0.7:      http://pan.baidu.com/s/1i3437FJ              result.wav

自由操控声音-相位声码器-变速篇(一)

时间: 2024-10-09 17:48:24

自由操控声音-相位声码器-变速篇(一)的相关文章

自由操控声音-相位声码器-变速篇(二)

除了通过时域OLA变速,重构相位的方法外,也可以直接对声音的频谱进行拉伸或者收缩,像手风琴一样,保持谐波结构不变, 延长或者缩短时间. 对应于语音,就是对语谱图的拉伸或者收缩,首先对短时傅里叶变换的幅度谱进行插值或者抽取,接着对相位进行调整, 傅里 叶逆变换之后重新叠加合成声音.             OLA相位调整方法                                  频谱插值.抽取方法            相位声码器相位调整变速0.7:     http://pan.ba

自由操控声音-相位声码器-变调篇(一)

相位声码器可以直接完成变速不变调的功能,要完成变调不变速功能,可以直接和重采样结合起来. 重采样放在变速之前和之后,对效果都没有什么影响. 特别推荐: 当做升调时,先做重采样,再做变速. 当做降调时,先做变速,再做重采样. 这样处理,可以减小运算处理时间.             原始                                                                         升调2倍               降调2倍           

AWS研究人员找到改善Alexa语音和声音辨识

AWS发表改善Alexa语音和声音辨识的两篇论文,皆是透过机器学习技术,来处理Alexa语音识别的问题.AWS第一个介绍的方法,是针对Alexa接收到来自电子媒体的干扰问题,像是电视或是收音机的声音,AWS团队开发出一套能够更好地辨识媒体音频的方法,且能够长时间持续检查音频,帮助Alexa过滤掉非用户语音的背景声音讯号.另一个方法则是利用外部数据集,透过半监督式学习法,来训练出语音事件侦测模型,半监督式学习法是采用小型已标注的训练数据集,来对照到大型未标注的数据集,尤其是,AWS团队是用Tri-

神逸之作:国产快速启动软件神品ALTRun

http://xbeta.info/altrun.htm 作者: ET民工和塞壬 日期: 2010-09-15 分类: windows 标签: quick-launch <神逸之作:国产快速启动软件神品ALTRun> 本文作者:塞壬 2010年8月首发于善用佳软 目录一.ALTRun软件简介1.1 界面观赏1.2 界面讲解二.ALTRun的基本使用方法2.1 超多方式执行快捷项(入门必读小节一)2.2 迅捷方便的定位方法(入门必读小节二)2.3 过滤筛选和智能匹配2.4 人性化的匹配设定2.5

用 Python 把电脑变钢琴

录一段音频,把它的音高改变50次并把每一个新的音频匹配到键盘的一个键位,你就能把电脑变成一架钢琴! 一段音频可以被编码为一组数值的数组(或者列表),像这样: 我们可以在数组中每隔一秒拿掉一秒的值来将这段音频的速度变成两倍: 如此我们不仅将音频的长度减半了,而且我们还将它的频率翻倍了,这样使得它拥有比原来更高的音高(pitch). 相反地,假如我们将数组中每个值重复一次,我们将得到一段更慢,周期更长,即音高更低的音频: 这里提供一个可以按任意系数改变音频速度的任意简单的Python函数: Pyth

一些对数学领域及数学研究的个人看法(转载自博士论坛wcboy)

转自:http://www.math.org.cn/forum.php?mod=viewthread&tid=14819&extra=&page=1 原作者: wcboy 现在的论坛质量比以前差了,大部分都是来解题问答的,而且层次较低.以前论坛中,Qullien很令人印象深刻,但愿他能在国外闯出一片天空.现在 基础数学版代数&数论子版中那几个讨论代数几何的还不错.不期望目前论坛出现很多高层次高手,高层次高手应该站在好课题上高观点讨论数学,出 现这样的网友,看他们的言论非常过

linux 入门必读文章

你从来只用过Windows,从来没接触过UNIX,只知道把一个文件拽来拽去,只知道硬盘就是C: D: E:却从来没有研究过分区表,也许会用VC编个程序,很习惯它的集成环境....    有一天,不管什么原因了,也许是看报纸上那些把内存和硬盘都分不清楚的记者的吹嘘,或者是老板要求你用它作个项目,或者是同学们都有了你没有觉得很土,或者你听说找工作有这个的经验就有更大希望....不管怎样,你想在自己的机器上安装一个Linux.OK,这个文章就是给你写的,因为从现在开始,你会有成堆的问题你会觉得从前在w

语音交互技术——语音基础

语音技术是研究用数字信号处理技术和机器学习方法对语音信号进行处理的一门学科.语音技术的目的: 得到某些参数以便高效传输或存储:或者是用于某种应用,如人工合成出语音.辨识出讲话者.识别出讲话内容.进行语音增强等. 语音编码:在保持可以接受的失真的情况下,采用尽可能少的比特数表示语音.脉冲编码调制(PCM).自适应预测编码.自适应变换编码.线性预测编码.线性预测声码器.共振峰声码器.相位声码器. 语音识别(ASR):把声音变成文字(耳朵的功能),相当于给机器装上了人工的耳朵.孤立词识别技术.连续语音

第10章 智能交通

10.1智能交通概述 10.1.1传统交通与智能交通   10.1.2智能交通的定义 智能交通在世界各地迅速推进,已成为现代交通的重要标志,然而,对于这个专用名词,国际上至今没有一个明确的定义.在美.欧.日的ITS推进组织的网页或有关资料中,我们看到分别有如下的叙述. “美国智能运输协会”(ITS America网址为型:i!望:Q蟹):ITS是由一些技术组成的,这些技术包括信息处理.通信.控制和电子技术.交通事故.拥挤使我们为生活.为损失的 生产率和浪费的能源付出了昂贵的代价.ITS可以通过新