软件需求:
首先你必须要有Moses(废话哈哈)、然后要有GIZA++用作词对齐(traning-model.perl的时候会用到)、IRSTLM产生语言模型
大致步骤:
大体的步骤如下:
- 准备Parallerl data(需要句子对齐):对语料进行tokenisation、truecasing和cleaning步骤之后才能使用于我们的机器翻译系统(哈哈,都快忍不住直接写详细步骤了)
- 训练你的语言模型(使用IRSTLM):当然也有几步,详细叙述再说
- 然后就是训练你的翻译系统啦(可能要花一两个小时):(2) run GIZA
(3) align words
(4) learn lexical translation
(5) extract phrases
(6) score phrases
(7) learn reordering model
(8) learn generation model
(9) create decoder config file - 最后是蛋疼的Tuning(当然你也可以自己手动的Tuning),大概要花几个小时
- 最后你就可以跑了,如果你嫌启动慢,可以把模型转化为Binarised-model来进行,会更快,当然这会需要你改动一些东西,不过很简单
详细步骤以及说明:
时间: 2024-11-05 20:31:30