实现过程:
一:关于病理嗓音的特征提取,这里分析的是嗓音疾病,而不是去分析所有疾病。
二:基于深度神经网络病理嗓音分类, 对嗓音病理性质进行分类,以及对嗓音疾病的严重程度进行分类。
相关的预备知识:
1.关于声音和嗓音形成的基本原理:
声音产生的本质是振动,物体的振动力度越大,响度越大;振动的频率越高,音调越高;不同物体发出的声音是不一样的,这取决于音色。人能听到声音的前提是音调在20到20000Hz,并且响度在一个范围内。这里有个问题,生活中我们常说一个人的声音太小了,听不见,这里指的是响度,如果声音的频率很小,但是响度很大,人耳依旧是听不到的。这里举个例子:
对于低音频超高响度的次声波,人耳没有这个感受能力,不会听到。人体倒是可以感受,如果能量足够,可以把人体震得肝肠断裂,超声波也是如此。
尽管物体振动了,也不一定能产生声波,这里有个前提就是介质,物体的振动带动空气分子的振动,就形成了声波,声波的传输速度为340m/s,这里注意声波是一种横波,纵波也有但是可以忽略不计。然后振动的空气分子引起耳膜的振动,并引起大脑的感知,人就感觉到了声音。
2.声音的基本参数:音调 响度 音色
很容易建立的几个坐标曲线就是,时间和响度,时间和音调。音色该如何辨别呢???*
3.我们该对声音的哪些特征参数进行提取,当然,这取决于分析模型中所需要的参数,这里介绍一下目前常用的声音模型,这里使用的是DNN也就是深度神经网络。为什么选择这个模型呢?
原文地址:https://www.cnblogs.com/misakimei/p/12141601.html
时间: 2024-10-13 04:02:14