作者:桂。
时间:2017-05-24 08:06:45
主要是《Speech enhancement: theory and practice》的读书笔记,全部内容可以点击这里。
1.语音增强(speech enhancement)主要从攻/防两面入手:quality + intelligibility,quality希望噪声尽可能抑制; intelligibility希望语音信号失真不严重,很多算法只从quality角度去分析问题.
2.语音增强的影响因素很多:
- 应用场景
- 比如空旷的原野,可以认为是加性,房间有混响则更接近卷积模型;这本书讨论的是加性噪声模型。
- 噪声源
- 白噪声、说话人,不同源的特性不同
- 目标信号与噪声的关系
- 如噪声与目标信号,可能统计相关也可能统计无关;这本书关注的是统计无关的模型。
- 传感器数量
- 多个传感器的阵列信号处理技术,又比如有两个mic:一个接近噪声源,可以借助adaptive filter技术处理;本书关注的是单mic的模型。
3.语音增强算法分类
- Spectral subtractive algorithms:谱减法
- Statistical-model-based algorithms:基于统计模型的算法
- Subspace algorithms:子空间算法
- Binary mask algorithms:二元掩模算法,可以理解成音频的分割算法
时间: 2024-09-29 22:56:35