结合Praat进行语音实验的步骤

近期更新了几篇Praat脚本从标注的TextGrid里提取数据一些脚本，发现有一些朋友会问到更细节的问题，于是有一个想法把结合Praat进行一个语音学上常用的实验研究的步骤都整理出来，希望对需要的朋友有所帮助。其实从事语音研究的可能大部分是语言学专业，对一些软件，脚本的使用可能不如工科类学生掌握快，而如果是一个工科出身的如果掌握这类的软件，脚本，可能不屑于看太仔细的说明，本文是针对偏语言学专业，力求让大家在进行实验研究的时候，不会太纠结于如何使用，而能更快速的完成自己的实验。欢迎提问，我会随时更新，以便能够力求完善。以下是我列出的一些主要操作，或者需要的相关研究，如果有更多的需求，未能
列出，欢迎指出。

准备：Praat的基本使用

Praat目前已经成为比较流行的语音处理的软件，它的使用也很方便，目前在网上有很多类似的教程，最有名的当属社科院语言所熊老师的教程，可以在语言所官方网站下载到，千万不要轻信个别网站的信息去购买这个教程。我在这里只提几个简单的操作，打开文件，标注文件，认识语谱图的几个主要特征，以及保存文件，其它操作如有兴趣可以下载熊老师的教程，仔细研读。

打开文件

1. 打开Praat---Open---Read from file...---找到对应的声音或者Textrid文件，打开即可

2. 打开到Praat窗口以后，创建一个空白的标注文件

Annotate---To TextGrid...

注意提前规划好你需要对这个声音文件标注几层信息，通常会标注音素信息，音节，或者字词信息，韵律信息，或者一些其它的信息，任意多层都可以设置，在这里只举例设置音素层和音节层。

3. 把声音文件和TextGrid文件都选择上，点击View & Edit，就可以进行标注了，标注时，根据听辨边界，以及查看语图的信息，确定音素或者音节的边界。具体的操作可参考熊老师的教程。

4. 认识语图上的几个主要特征，如果看不到基频线，共振峰线或者音强线，使用上面菜单上的show pitch, show formant, show intersity就可以了。

5. 保存文件

Praat---Save---Save as text file...---将这个标注文件保存为****.TextGrid即可。

第一步：录音阶段

语音学实验肯定是离不开录音，这里有很多选择，但是这一步不是本文的重点，因为可能每个人要求、条件不同，理论上我们建议所有人的录音都要高保真，即都要在专业的录音棚里，保证所有的声音在统一的条件下，几乎做到没有噪声控制的最低，这样的声音是最好的。但是未必大家都会有这样的条件，举例来说，如果一个人要做一个小方言的研究，可能这个方言的区域都是比较偏远的地区，这些地方甚至出行都比较困难，可能很难有这样专业的录音场所，而且由于录音对象的选择，也未必可能把所有录音人都请到专业录音棚里，所以这时候只能退而求其次，带着一些设备到他们身边，这也有一个专门的领域称为“田野语音学”。所以这时候，你可能只能保证自己所带的设备，尽量能够做到抗噪性较好。我不是对设备比较专业的人，这方面可能可以咨询一下记者类的工作人员，他们有一些便携的设备可以采用。另外也可以通过自己的笔记本，配置一个外置声卡，一个相对较专业的话筒，也足够了。

不管是采用什么方式，最终我们需要的是这些设备+软件采集到的声音文件，通常我们需要的是wav格式，尽量不要使用mp3之类的格式，这是经过压缩的。wav格式一般注意一下采样率在16K以上，具体的录音过程请搜索更专业的文章，如果是用个人电脑录音，推荐使用CoolEdit或者Adobe Audition录音。

另外在录音时还有一个细节，相信每个人的研究都不是简单的几个声音，而是成批的，比如上百个声音，或者上千个，每个声音单位可能是一个元音辅音，一个字，一个词，一个句子。。。这时候就要注意录音的方式了。一种方式是你每录完一个单位，比如录完一个词“开始”，然后停下录音，然后把这个声音保存为比如Test001_开始.wav，然后进行下一个词，如果这样录上千个声音，那被录音人可是受不了的！所以一般的情况，我们需要给一个列表，然后让录音人一直录下去，最后把这个大的声音要进行切分，切成这样小的单位。为什么要切分呢？因为不切分，无论是标注，还是提取数据，等都非常不方便，而且不利于检索。

这里就涉及到一个切分的方法问题，你可以再通过笨方法，用CoolEdit打开这个长声音，一个声音一个声音的选择上，然后分别保存为自己需要的名称，几千个文件下来，相信已经头晕眼花，而且容易出错。下一步就是推荐一个相对较灵巧的办法，当然是可选的。另外这个办法的前提你要保证录音中每个单位之间有较足够的停顿，而不是连接在一起的。以下给出一个例子，保持这样的方式，就是比较容易使用自动切分的。

第二步：长声音切分

请参考以下博文：Praat将连续录制的声音文件切成小单位文件

http://blog.csdn.net/shaopengfei/article/details/20928683

第三步：人工标注语音

现在有了声音之后，就是要进行标注了，先介绍一种是全人工标注的，这种方法可能比较麻烦，费时间，但是可能准确率是自己控制的，以下第四步要介绍的自动标注，虽然指生成，但是准确率肯定还需要人工干预，好处就是不需要人工添加很多边界等，所以本人还是推荐使用自动标注的方法，然后人工仔细调整边界。有一种办法是打开Praat，然后打开一个声音，生成一个空白的标注文件，根据自己的需要设置几层，然后分别标注里面的信息。然后再保存这个标注文件。这样操作会很繁琐，大量的时间耗费在生成空白的TextGrid、生成边界以及保存操作上。本人提供了一个工具，通过这个工具，自动生成TextGrid，然后会生成一个空的音素边界，调整好之后，再保存就可以了。

请参考以下博文：辅助Praat进行标注的工具

http://blog.csdn.net/shaopengfei/article/details/43020707

第四步：自动标注语音SPPAS

第二步切出来的声音文件，同样会生成一个录音的文本，这样才能利用SPPAS这个工具，自动生成初始的标注文件。

请参考以下博文：语音标注自动音段对齐工具SPPAS使用笔记

http://blog.csdn.net/shaopengfei/article/details/18351809

第五步：人工调整自动标注的结果

这一步参考第三步即可。

第六步：人工修基频

第七步：提取参数-基频

第八步：提取参数-共振峰

第九步：声学元音图

第十步：句子语调图

第十一步：汉字声调图

[更新中...]

时间： 2024-08-29 23:22:21

结合Praat进行语音实验的步骤

准备：Praat的基本使用

第一步：录音阶段

第二步：长声音切分

第三步：人工标注语音

第四步：自动标注语音SPPAS

第五步：人工调整自动标注的结果

结合Praat进行语音实验的步骤的相关文章

设置共享实验准备步骤

接入百度语音SDK的步骤

利用DoHome APP和音箱控制LED灯实验参考步骤

利用DoHome APP和音箱控制小车的实验参考步骤

mpls 相关实验排错步骤

实验二统计压缩方法的具体实现

20135314朱恒志-实验三

20145209&20145309信息安全系统设计基础实验报告（3）

组播实验