作者:桂。
时间:2017-05-10 19:17:32
链接:http://www.cnblogs.com/xingshansi/p/6832219.html
一、环境
- python3.5
- Win8.1,64位
二、Wavenet安装
Wavenet安装环境:
- Tensorflow:1.0.1以上版本,查看自己的版本:
- librosa工具包:用来读写audio文件,之前已经安装;
有了上面的条件,
- 在Github上下载Wavenet工具包,关于Wavenet工具包,也有学者提出了Fast wavenet
- 用于Wavenet训练的语料库CSTR VCTK Corpus
将tensorflow-wavenet文件夹放在:\Anaconda3\Lib\文件夹下,cd到对应路径并运行:
pip install -r requirements.txt
安装tensorflow-wavenet完毕:
下载VCTK数据库,并解压:
python切换到指定路径下,输入:
python train.py --help
可以查看函数具体用法:
VCTK/wav48/中不同文件夹的音频信息:
将VCTK/wav48/的部分音频复制,形成一个用于训练的wav文件夹:
并修改train.py对应指令:
运行train.py报错:
stackoverflow给出了解答:
按照这个说法,新建logdir:
并修改train.py的代码:
训练过程中有许多warning的提示,意思是音频基本都是寂静音,因此进行忽略:
原程序中:SILENCE_THRESHOLD = 0.3,这里参考stackoverflow的说法:
将SILENCE_THRESHOLD设定为0.1,可以看到虽然还有部分是warninig,但已经可以training了:
同样,generate.py的路径也修改一下:
generate.py的结果有点像噪声,可能操作有问题,记录在此:
打算后面学习Wavenet,Wavenet的更多内容参考Github.
涉及到的概念较多,后面打算学习一些Tensorflow的知识并系统学习深度神经网络的相关知识。
时间: 2024-10-06 05:42:31