语音的生成

一、语音的产生

肺部受到肌肉力量,产生肺压,生成压缩气体,

气体通过气管传送到喉部,喉是控制声带运动的软骨和肌肉的复杂系统,

然后经过声带进入声道,声道通常是指声门至口唇的单个管,侧分支通向鼻腔,

最后由口唇辐射出声波,这就形成了语音。

二、语音生成的数字模型

(一)激励模型

1、浊音的时间波形呈现出一定的周期性,波形之间的相似性较好

在浊音的发声期间喉部声带的循环(打开和关闭)速率被称为基频F0=1/T0

基频F0对语音中的音高感觉的影响比其他任何单一因素的贡献都大

2、清音的时间波形呈现出随机噪声的特性,杂乱无章,相似性较差

3、声带周期性打开和关闭过程中产生的连续的空气爆发是所有有声的/浊音的能量来源(通常,元音、浊辅音的能量更多)

(二)声道模型

气流通过声道时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减。

由于能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。

共振峰取决于声道的形状,因此不同的语音对应于一组不同的共振峰(通常用于浊音)。

(三)辐射模型

声道模型输出的是速度波,而语音信号是声压波。

二者的倒比称为辐射阻抗,它表示口唇的辐射效应。

口唇辐射消耗在高频段较为显著,低频段影响较小。

时间: 2024-12-21 21:27:11

语音的生成的相关文章

隐马尔可夫模型HMM与维特比Veterbi算法(一)

隐马尔可夫模型HMM与维特比Veterbi算法(一) 主要内容: 1.一个简单的例子 2.生成模式(Generating Patterns) 3.隐藏模式(Hidden Patterns) 4.隐马尔可夫模型(Hidden Markov Model) 一.一个简单的例子 考虑一个简单的例子,有人试图通过一片海藻推断天气--民间传说告诉我们'湿透的'海藻意味着潮湿阴雨,而'干燥的'海藻则意味着阳光灿烂.如果它处于一个中间状态('有湿气'),我们就无法确定天气如何.然而,天气的状态并没有受限于海藻的

Michael Collins NLP课程讲义(翻译:Trey;审校:Shooya)

第一章 语言模型 (自然语言处理课程讲义,Michael Collins,哥伦比亚大学) 1.1 介绍 在这一节,我们将考虑一个问题,即如何为一个例句集建立语言模型.语言模型最初从语音识别发展起来:对现代的语言识别系统,语言模型依然起着中心作用.语言模型在其他自然语言处理应用中也被广泛应用.我们将在本章讨论参数估计技术.参数估计技术最初为语言模型而生,在很多场合都有用,譬如在接下来的章节中将会讨论到的标注问题和句法分析问题. 我们的任务如下.假设我们有一个语料库--某特定语言的句子集.譬如说,我

Michael Collins自然语言处理课程讲义(翻译:Trey)

第一章 语言模型 (Michael Collins的自然语言处理课程讲义,哥伦比亚大学) 1.1 介绍 在这一节,我们将考虑一个问题,即如何为一个例句集建立语言模型.语言模型最初从语音识别发展起来:对现代的语言识别系统,语言模型依然起着中心作用.语言模型在其他自然语言处理应用中也被广泛应用.我们将在本章讨论参数估计技术.参数估计技术最初为语言模型而生,在很多场合都有用,譬如在接下来的章节中将会讨论到的标注问题和句法分析问题. 我们的任务如下.假设我们有一个语料库--某特定语言的句子集.譬如说,我

[sphinx][语音识别]学习笔记

[http://www.voxforge.org/home/dev] 1.声学模型训练 声学模型的训练过程,就是使用你的语音数据生成说话人独立的声学模型,或者将Voxforge在线的声学模型适应你的声音特色. Linux 训练你自己特色的声学模型 How-to - using a script Tutorial - step-by-step (with explanations) 为了提高你自己创建的声学模型的识别率,你需要使用更多小时的录音来训练一个声学模型,一个更快捷的方法是,将VoxFor

*音频-2

4.2音频 4.2.1数字声音基础 1.声音信号 声音是通过空气传播的一种连续的波,称为声波,声波在时间和幅度上都是连续的模拟信号,通常称为模拟声音(音频)信号.人们对声音的感觉主要有音量.音调和音色三个指标. (1)      音量(响度).声音的强弱程度,取决于声音波形的幅度,即取决于振幅的大小和强弱. (2)      音调.人对声音频率的感觉表现为音调的高低,取决于声波的基频,基频越低,给人的感觉越低沉,频率高则声音尖锐. (3)      音色.由混入基音(基波)的泛音所决定,每种声音

EMIPLIB库分析二

前一篇中详细分析了MIPComponentChain类.了解了执行框架的运作情况.还有必要知晓框架的实现细节,以便于真正掌握库的设计意图.有一点有些模糊,就是MIPComponnet间传递数据这一部分.现在只是有个大致的了解.pull component生成消息,push component接收这些消息.仍然以feedbackexample例程为研究对象. feedbackexample例程中,在启动处理过程前,会生成很多MIPComponent,然后依据顺序放入MIPComponentChai

【Python + Flask + Web录音 + baidu-aip + 图灵机器人 = 人机对话】 𚀒

原文: http://blog.gqylpy.com/gqy/351 安装baidu-aip:pip install baidu-aip 百度云网址:https://login.bce.baidu.com 百度语音合成文档:https://ai.baidu.com/docs#/TTS-Online-Python-SDK/top 百度语音识别文档:https://ai.baidu.com/docs#/ASR-Online-Python-SDK/top 百度自然语言处理基础技术文档:https://

asp.net使用SpeechSynthesizer类生成语音文件部署到iis遇到的几个坑

首先需要引入命名空间System.Speech.Synthesis,代码如下: using (var speechSyn = new SpeechSynthesizer()) { speechSyn.Volume = 60;//语速 speechSyn.Rate = -2;//音量 speechSyn.SetOutputToDefaultAudioDevice(); speechSyn.SetOutputToWaveFile(fullFileName);//"D:\\Record.wav&quo

go语音之进阶篇通过结构体生成json

1.通过结构体生成json 示例: package main import ( "encoding/json" "fmt" ) //成员变量名首字母必须大写 type IT struct { Company string Subjects []string IsOk bool Price float64 } func main() { //定义一个结构体变量,同时初始化 s := IT{"itcast", []string{"Go&qu