声学的一些基本知识(心理声学)

心理声学(psycho acoustics)是研究声音和它引起的听觉之间关系的一门学科。人耳对声音的感知是高度非线性了。由于人耳听觉系统复杂,人类迄今为止对它的机理和听觉特性的某些问题还不能从生理解剖角度完全解释清楚。所以,就出现了心里声学这一在心理声学和语言声学内对对人耳听觉特性进行研究的学科。

人耳对不同强度和不同频率声音的一定听觉范围称为声域。在人耳的声域范围内,声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽效应、高频定位等特性。而对于多种音源场合的人的耳掩蔽效应等特性尤为重要,它是心理声学的基础。

一个健康的年轻人的对声音频率的感知范围大约是 20-20KHz。低于20Hz的声波称为次声波(infrasound),一般认为声强在120dB 以下时不会对人体造成伤害。高于20KHz 的声波称为超声波(ultrasound),声强在105dB 以下时不会对人体造成伤害。人耳最敏感(同时也是对人耳伤害最大)的频率范围是500Hz—2KHz。

听阈(Threshold of hearing)

听阈分强度阈和差阈。所谓强度阈指的是人耳能够分辨的最小的声音强度变化。这种感知主观性很大,实验时取被测试者能有50%的次数分辨出强度差异声强差为强度阈(也称听阈)。下表给出了在中等声音频率、中等声音强度下的一些实验结果。当声源声强差别3dB时人耳勉强能有所感知。当声源声强差别5dB时就可以清晰的感知到,声源声强差别10dB时,我们会觉得一个声音比另一个声音大一倍左右。声源声强差别20dB就会感觉一个声音明显比另一个大很多。

响度(Loudness)

当两个声音听起来感觉声音强度相同时我们就说这两个声音的响度相同。最早和普遍认可的响度单位是方(Phon)和宋(Sone)。

Phon 定义为某一个声音与之等响度的1KHz 单频声音的声强值。举例来说,某一个声音响度为 60 Phon,那么它与60dB 的1KHz 正弦波声音听起来强度相同。1kHz 单频声音 40dB 时为1 Sone,每增加10dB,响度增加一倍。 Sone 不太常用。

人耳对声音响度的感知是随频率和声强不同而变化的。下面给出实验得到的等响度曲线。最下面的虚线表示人耳能感知的最小声音响度,称为minimum audible field (MAF)。

音高(Pitch)

所谓音高与声音的频率有关,但又不完全取决于声音的频率。我们知道一个周期函数可以做傅立叶级数展开,分解为基频、2次谐波、3次谐波等。对于这样的声音,我们感知的音高就是基频分量。但是如果只是把这个声音的基频分量去掉,我们感知的音高还是不变的,人耳似乎能自动补上这个缺失的基频成分。但是如果我们再进一步,将3次谐波、5次谐波等奇次谐波全部去掉,我们感知的音高就高了一个8度。很奇妙,似乎高频分量对我们感知的音高有很大的作用。

音高也与声强有关,如果以60dB的某个声音作为基准音高,那么声强大于60dB时,500Hz以下频率声音我们会感觉音高变低,而500Hz以上频率声音我们会感觉音高变高了。

声掩蔽(Masking)

一个声信号如果与一种噪声同时出现,它将变得微弱或完全听不清楚,即是说信号的听阈提高了。这就是掩蔽效应,噪声掩蔽了信号。掩蔽效应的大小取决于噪声和信号在频率上的关系。一般说,信号与噪声的频率越接近,掩蔽也越大,且低频噪声对高频信号的掩蔽常大于高频噪声对低频信号的掩蔽。通过带宽可变的噪声对纯音信号的掩蔽实验发现,当以1000Hz为中心频率的噪声增加带宽时,它对 1000Hz纯音信号的掩蔽效应也随着增加。但带宽增至100Hz以后,再增加就对掩蔽的改变不起作用。就是说,这个噪声的掩蔽作用只限制在这个频带内,以外的声音无作用。这个100Hz的频带称为临界频带。它随频率的提高而加宽。

时间: 2024-10-02 05:51:23

声学的一些基本知识(心理声学)的相关文章

声学的一些基本知识(1)

声速 20℃,1个大气压时,空气中的声速为 343m/s,当温度变化不大时,声速可以近似表示为: 利用热力学基本原理还能得到另一个理论公式: 这里 Tk 是热力学温度,单位为开尔文,R 是气体常数,值为8.314 J/mol,M 是气体摩尔质量,对于空气来说是 0.029kg/mol,γ是气体的比热,对于空气是 1.402. Sound Pressure Level 声压级 所谓声压(Sound pressure 或 acoustic pressure)是指的声场中某一位置某一时刻气体压强与平均

语音识别之初体验

一.概述 作为最自然的人机交互方式 --语音,正在改变人们的生活,丰富多媒体技术的应用.语音识别技术是语音信号处理的一个重要分支,也是近年来很火的一个研究领域.随着科技的飞速发展,语音识别不仅在桌面PC和大型工作站得到了广泛应用,而且在嵌入式系统领域也占有一席之地,如智能家居.苹果的Siri.车载语音识别系统等.相信在不久的将来,语音识别技术必定会渗透在人们生活的每个角落. 二.语音识别系统的分类 语音识别按照说话人的说话方式可以分为孤立词(IsolatedWord)识别.连接词(Connect

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models

基于因子分解的隐层变量学习,应用于短语句语种识别模型的自适应 LFVs(Language Feature Vectors,语种特征向量)[11],与BSVs(Bottleneck Speaker Vectors)类似,即瓶颈特征 3.1. 神经元调制 由于说话人特性的变化反映在语音信号中,因此将表示说话人适应声学特性的特征拼接到特征中.如VTLN或fMLLR,是直接对声学特征进行操作的自适应方法.可以训练一个说话人自适应系统以基于说话人属性直接对输入特征进行转换,这样效果与基于i-Vector的

【转载】心理声学基本知识

心理声学的基本要素是到达人耳的声音的频率.强度和谱结构.以下将进一步讨论基于心理声学的声源定位.距离感知及包围感等. 2.2.1 人耳对声源的定位 在自然听音中,人的听觉系统对声源的定位取决于多个因素——双耳接收到的信号差异用来决定声源的水平位置,由外耳对高频信号的反射所引起的耳郭效应决定声源的垂直位置,而人耳的某些心理声学特性对于声源的定位也起到很大的作用. 2.2.1.1 双耳效应 在自然听音环境中,双耳信号之间的差异对于声源的定位是非常重要的.该因素可以在直达声场的听音环境中得到最好解释,

【转载】声学——科学、技术与艺术

声学是一门具有广泛应用性的学科,涉及到人类生产.生活及社会活动的各个方面:同时声学又是一门具有很强交叉渗透性的学科,与各种新学科.新技术相互作用,相互促进,不断地吸收.应用和发展新的思想,增强了声学的生命力.竞争力和学术与艺术魅力.本文从科学.技术与艺术等几个方面,介绍了声学的学科发展,特别是在科学与技术上的新的研究方向与进展. 一.声学的基本概念 声和音 讲到声学,当然首先就要讲什么是声音.所谓声,实际上有双重的含义,我们一般地理解,人的耳朵能够感觉到的声波的作用就称之为声,这么说大家都懂:但

《统计自然语言处理》读书笔记 一.基础知识及概念介绍

最近准备学习自然语言处理相关的知识,主要参考<统计自然语言处理·宗成庆>和<Natural Language Processing with Python>,推荐大家阅读.第一篇主要介绍的是NLP的基础知识和概念介绍,其实也是我关于NLP的读书笔记吧,希望对大家有所帮助. 一. 概念介绍 自然语言处理 自然语言处理(Natural Language Processing,简称NLP)技术的产生可追溯到20世纪50年代,它是一门集语言学.数学(代数.概率).计算机科学和认知科学等于一

[从头学声学] 第202节 复合的声波(1)

剧情提要: [机器小伟]在[工程师阿伟]的陪同下进行着声学神通的修炼. 这次要研究的是[复合的声波(1)]. 正剧开始: 星历2016年05月02日 16:31:19, 银河系厄尔斯星球中华帝国江南行省. [工程师阿伟]正在和[机器小伟]一起研究[复合的声波(1)]. 从这节开始,[机器小伟]要细细地研究各种声波,知识并不多, 声音这东西,当然要多听啦. 复合波大致就长这样. if (1) { var r = 20; config.setSector(1,1,1,1); config.graph

【转载】音频基础知识

音频,英文是AUDIO,也许你会在录像机或VCD的背板上看到过AUDIO输出或输入口.这样我们可以很通俗地解释音频,只要是我们听得见的声音,就可以作为音频信号进行传输.有关音频的物理属性由于过于专业,请大家参考其他资料.自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码.PCM通过采样.量化.编码三个步骤将连续变化的模拟信号转换为数字编码. 一.音频基本概念 1. 什么是采样率和采样大小(位/bit). 声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于

音频相关的基本知识

最近的项目需要和音频打交道,所以网上搜集了一些音频相关的基本知识,整理如下 自然界中的声音非常复杂,波形极其复杂,通常我们采用脉冲编码码调制编码,即PCM编码.PCM编码通过抽样.量化.编码三个步骤将连续变化的模拟信号转换为数字信号 采样(sample) 数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的(原始声音是模拟信号),实现这个步骤使用的设备是模/数转换器(A/D转换器,或者ADC,或者analog to digital convert).它以每秒上万次的速率对声波进行