基于深度神经网络的病理嗓音研究

实现过程:

一:关于病理嗓音的特征提取，这里分析的是嗓音疾病，而不是去分析所有疾病。

二:基于深度神经网络病理嗓音分类，对嗓音病理性质进行分类，以及对嗓音疾病的严重程度进行分类。

相关的预备知识:

1.关于声音和嗓音形成的基本原理:
声音产生的本质是振动，物体的振动力度越大，响度越大；振动的频率越高，音调越高；不同物体发出的声音是不一样的，这取决于音色。人能听到声音的前提是音调在20到20000Hz，并且响度在一个范围内。这里有个问题，生活中我们常说一个人的声音太小了，听不见，这里指的是响度，如果声音的频率很小，但是响度很大，人耳依旧是听不到的。这里举个例子：
对于低音频超高响度的次声波，人耳没有这个感受能力，不会听到。人体倒是可以感受，如果能量足够，可以把人体震得肝肠断裂，超声波也是如此。
尽管物体振动了，也不一定能产生声波，这里有个前提就是介质，物体的振动带动空气分子的振动，就形成了声波，声波的传输速度为340m/s，这里注意声波是一种横波，纵波也有但是可以忽略不计。然后振动的空气分子引起耳膜的振动，并引起大脑的感知，人就感觉到了声音。
2.声音的基本参数:音调响度音色
很容易建立的几个坐标曲线就是，时间和响度，时间和音调。音色该如何辨别呢？？？*
3.我们该对声音的哪些特征参数进行提取，当然，这取决于分析模型中所需要的参数，这里介绍一下目前常用的声音模型，这里使用的是DNN也就是深度神经网络。为什么选择这个模型呢？

原文地址：https://www.cnblogs.com/misakimei/p/12141601.html

时间： 2024-10-13 04:02:14

基于深度神经网络的病理嗓音研究

实现过程:

一:关于病理嗓音的特征提取，这里分析的是嗓音疾病，而不是去分析所有疾病。

二:基于深度神经网络病理嗓音分类，对嗓音病理性质进行分类，以及对嗓音疾病的严重程度进行分类。

相关的预备知识: