自由操控声音-相位声码器-变调篇(一)

相位声码器可以直接完成变速不变调的功能，要完成变调不变速功能，可以直接和重采样结合起来。

重采样放在变速之前和之后，对效果都没有什么影响。

特别推荐：

当做升调时，先做重采样，再做变速。

当做降调时，先做变速，再做重采样。

这样处理，可以减小运算处理时间。

原始升调2倍

降调2倍升调10/7

重采样结合变速的变调方法，基本上满足了一般的需求，但是从技术上来说，唯一的限制，就是只能

进行线性倍数的变调，不能进行更加复杂，任意的变调。

材料： http://pan.baidu.com/s/14bW8A

自由操控声音-相位声码器-变调篇(一)

时间： 2024-10-11 09:06:47

自由操控声音-相位声码器-变调篇(一)的相关文章

自由操控声音-相位声码器-变速篇(一)

比较古董的声码器:LPC声码器,相位声码器 LPC声码器就是用全极点模型来表示浊音,近似清音,根据最小平方误差最小化原则,得到该模型的一组参数,就是LPC系数,对系数量化编码,可以大幅压缩数据量:从时域来分析,就是用过去的一组样本点来预测现在的样本点. 从短时傅里叶变换和逆变换可以推导出,一个信号x(n)通过一组滤波器组,在满足一定条件下,这些滤波后的各个频段信号累积起来,可以还原x(n). 这组滤波器其实就是由窗函数(低通滤波器)调制到不同的频率段上,构成一组带通滤波器.滤波器组的N个通道的中

自由操控声音-相位声码器-变速篇(二)

除了通过时域OLA变速,重构相位的方法外,也可以直接对声音的频谱进行拉伸或者收缩,像手风琴一样,保持谐波结构不变, 延长或者缩短时间. 对应于语音,就是对语谱图的拉伸或者收缩,首先对短时傅里叶变换的幅度谱进行插值或者抽取,接着对相位进行调整, 傅里叶逆变换之后重新叠加合成声音. OLA相位调整方法频谱插值.抽取方法相位声码器相位调整变速0.7: http://pan.ba

AWS研究人员找到改善Alexa语音和声音辨识

AWS发表改善Alexa语音和声音辨识的两篇论文,皆是透过机器学习技术,来处理Alexa语音识别的问题.AWS第一个介绍的方法,是针对Alexa接收到来自电子媒体的干扰问题,像是电视或是收音机的声音,AWS团队开发出一套能够更好地辨识媒体音频的方法,且能够长时间持续检查音频,帮助Alexa过滤掉非用户语音的背景声音讯号.另一个方法则是利用外部数据集,透过半监督式学习法,来训练出语音事件侦测模型,半监督式学习法是采用小型已标注的训练数据集,来对照到大型未标注的数据集,尤其是,AWS团队是用Tri-

神逸之作：国产快速启动软件神品ALTRun

http://xbeta.info/altrun.htm 作者: ET民工和塞壬日期: 2010-09-15 分类: windows 标签: quick-launch <神逸之作:国产快速启动软件神品ALTRun> 本文作者:塞壬 2010年8月首发于善用佳软目录一.ALTRun软件简介1.1 界面观赏1.2 界面讲解二.ALTRun的基本使用方法2.1 超多方式执行快捷项(入门必读小节一)2.2 迅捷方便的定位方法(入门必读小节二)2.3 过滤筛选和智能匹配2.4 人性化的匹配设定2.5

用 Python 把电脑变钢琴

录一段音频,把它的音高改变50次并把每一个新的音频匹配到键盘的一个键位,你就能把电脑变成一架钢琴! 一段音频可以被编码为一组数值的数组(或者列表),像这样: 我们可以在数组中每隔一秒拿掉一秒的值来将这段音频的速度变成两倍: 如此我们不仅将音频的长度减半了,而且我们还将它的频率翻倍了,这样使得它拥有比原来更高的音高(pitch). 相反地,假如我们将数组中每个值重复一次,我们将得到一段更慢,周期更长,即音高更低的音频: 这里提供一个可以按任意系数改变音频速度的任意简单的Python函数: Pyth

一些对数学领域及数学研究的个人看法（转载自博士论坛wcboy）

转自:http://www.math.org.cn/forum.php?mod=viewthread&tid=14819&extra=&page=1 原作者: wcboy 现在的论坛质量比以前差了,大部分都是来解题问答的,而且层次较低.以前论坛中,Qullien很令人印象深刻,但愿他能在国外闯出一片天空.现在基础数学版代数&数论子版中那几个讨论代数几何的还不错.不期望目前论坛出现很多高层次高手,高层次高手应该站在好课题上高观点讨论数学,出现这样的网友,看他们的言论非常过

Sox语音转换的相关知识

SoX-linux 里操作音频的瑞士军刀 Sox是最为著名的Open Source声音文件格式转换工具.已经被广泛移植到Dos.windows.OS2.Sun.Next.Unix.Linux等多个操作系统平台.Sox项目是由Lance Norskog创立的,后来被众多的开发者逐步完善,现在已经能够支持很多种声音文件格式和声音处理效果.基本上常见的声音格式都能够支持.更加有用的是,Sox能够进行声音滤波.采样频率转换,这对那些从事声讯平台开发或维护的朋友非常有用.当然,Sox里面也包括一些D

linux 入门必读文章

你从来只用过Windows,从来没接触过UNIX,只知道把一个文件拽来拽去,只知道硬盘就是C: D: E:却从来没有研究过分区表,也许会用VC编个程序,很习惯它的集成环境.... 有一天,不管什么原因了,也许是看报纸上那些把内存和硬盘都分不清楚的记者的吹嘘,或者是老板要求你用它作个项目,或者是同学们都有了你没有觉得很土,或者你听说找工作有这个的经验就有更大希望....不管怎样,你想在自己的机器上安装一个Linux.OK,这个文章就是给你写的,因为从现在开始,你会有成堆的问题你会觉得从前在w

语音交互技术——语音基础

语音技术是研究用数字信号处理技术和机器学习方法对语音信号进行处理的一门学科.语音技术的目的: 得到某些参数以便高效传输或存储:或者是用于某种应用,如人工合成出语音.辨识出讲话者.识别出讲话内容.进行语音增强等. 语音编码:在保持可以接受的失真的情况下,采用尽可能少的比特数表示语音.脉冲编码调制(PCM).自适应预测编码.自适应变换编码.线性预测编码.线性预测声码器.共振峰声码器.相位声码器. 语音识别(ASR):把声音变成文字(耳朵的功能),相当于给机器装上了人工的耳朵.孤立词识别技术.连续语音