DNN深度神经网络对齐

1. 论文【1】中使用了DNN的思想进行对齐,对齐所需训练数据来自HMM和IBM Model4,算上输入层一共是四层结构,见下图:

  

  效果好于原始的HMM和IBM4,见下图:

  

  该思路可以用在许多地方,诸如:片段相似度、句子相似度、翻译概率、词向量等计算上。

  

  不过,实际应用的话,DNN还是不能完全击败其他方法,从原理上来说,构造一个包含上下文特征的机器学习模型与此类似,当然可能有人会说词向量隐含了更多特征在其中,但从博主实际使用和观察中看来,词向量作用依然有限,问题可能在于语言的丰富含义与灵活组合上,语言这种东西是活的,而数学表征是死的。

  

  举个例子:词向量相当于将一个字词看作了一个固定的工业零件,它有自己的规格参数,放在什么位置一目了然,但是很可惜,语言这个东西似乎没有那么简单,一个字词更像是一块液态金属,它不仅拥有现在的形状和大小,还可以与其他多种金属块组合,形成新的形状被赋予新的使用方式,例如big这个词有“大”的含义,但如我说big很高呢,那就是“逼格”的意思了,简单的用固定好的维度是无法表示出一个活灵活现的词语的。

  说白了,词语是活的,向量是死的。

  这就是我认为词向量虽然很有用,但是又不太实用的原因吧,个人有些不太成熟的想法,还有待验证。

2. 知识点:

  待补充。。。

  

3. 近似代码实现(python版,使用IBM Model1 + NN):

  后续补充。。。

引用:

  【1】ACL‘13, Word Alignment Modeling with Context Dependent Deep Neural Network

转载请注明引用自:

  http://www.cnblogs.com/breakthings/p/4049854.html

时间: 2024-11-09 06:27:11

DNN深度神经网络对齐的相关文章

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)

CNN(卷积神经网络).RNN(循环神经网络).DNN(深度神经网络)的内部网络结构有什么区别? DNN以神经网络为载体,重在深度,可以说是一个统称.RNN,回归型网络,用于序列数据,并且有了一定的记忆效应,辅之以lstm.CNN应该侧重空间映射,图像数据尤为贴合此场景. DNN以神经网络为载体,重在深度,可以说是一个统称.RNN,回归型网络,用于序列数据,并且有了一定的记忆效应,辅之以lstm.CNN应该侧重空间映射,图像数据尤为贴合此场景. Stanford University CS231

深度神经网络DNN的多GPU数据并行框架 及其在语音识别的应用

深度神经网络(Deep Neural Networks, 简称DNN)是近年来机器学习领域中的研究热点,产生了广泛的应用.DNN具有深层结构.数千万参数需要学习,导致训练非常耗时.GPU有强大的计算能力,适合于加速深度神经网络训练.DNN的单机多GPU数据并行框架是腾讯深度学习平台的一部分,腾讯深度学习平台技术团队实现了数据并行技术加速DNN训练,提供公用算法简化实验过程.对微信语音识别应用,在模型收敛速度和模型性能上都取得了有效提升--相比单GPU 4.6倍加速比,数十亿样本的训练数天收敛,测

深度神经网络全面概述:从基本概念到实际模型和硬件基础

国内镜像:苏轶然-CSDN 论文地址:https://arxiv.org/pdf/1703.09039.pdf 原文地址:机器之心-深度神经网络全面概述:从基本概念到实际模型和硬件基础 目前,包括计算机视觉.语音识别和机器人在内的诸多人工智能应用已广泛使用了深度神经网络(deep neural networks,DNN).DNN 在很多人工智能任务之中表现出了当前最佳的准确度,但同时也存在着计算复杂度高的问题.因此,那些能帮助 DNN 高效处理并提升效率和吞吐量,同时又无损于表现准确度或不会增加

第十一章——训练深度神经网络

上一章我们训练了一个浅层神经网络,只要两个隐层.但如果处理复杂的问题,例如从高分辨率图像中识别上百种类的物品,这就需要训练一个深度DNN.也行包含十层,每层上百个神经元,几十万个连接.这绝不是闹着玩的: 首先,需要面对梯度消失(或者相对的梯度爆炸)问题,这会导致浅层很难被训练. 其次,这么大一个网络,训练速度很慢. 最后,一个包含上百万参数的模型,存在很大过拟合的风险. 11.1 梯度消失(爆炸)问题 反向传播算法会计算损失函数关于每一个参数的偏导数,然后使用梯度下降更新参数.不幸的是,反向传播

如何利用Python和深度神经网络锁定即将流失的客户?业绩过十万!

烦恼 作为一名数据分析师,你来到这家跨国银行工作已经半年了. 今天上午,老板把你叫到办公室,面色凝重. 你心里直打鼓,以为自己捅了什么篓子.幸好老板的话让你很快打消了顾虑. 客户主要分布在法国.德国和西班牙. 你手里掌握的信息,包括他们的年龄.性别.信用.办卡信息等.客户是否已流失的信息在最后一列(Exited). 请选择左侧的Python 3.6版本下载安装. 其次是新建文件夹,起名为demo-customer-churn-ann,并且从这个链接下载数据,放到该文件夹下. 点击界面右上方的Ne

使用Python中NetworkX包绘制深度神经网络结构图

1 """ 使用Python中NetworkX包绘制深度神经网络结构图 """ 2 # 导入相应包 3 import networkx as nx 4 import matplotlib.pyplot as plt 5 6 # 创建DAG 7 G = nx.DiGraph() 8 9 # 创建结构图顶点列表 10 vertex_list = ['v'+str(i) for i in range(1, 22)] 11 12 # 添加结构图顶点 13

numpy 构建深度神经网络来识别图片中是否有猫

目录 1 构建数据 2 随机初始化数据 3 前向传播 4 计算损失 5 反向传播 6 更新参数 7 构建模型 8 预测 9 开始训练 10 进行预测 11 以图片的形式展示预测后的结果 搭建简单神经网络来识别图片中是否有猫 代码借鉴地址:纯用NumPy实现神经网络 搭建一个简单易懂的神经网络来帮你理解深度神经网络 通过简单的猫识别的例子来帮你进一步进行理解 本代码用 numpy 来实现,不含有正则化,批量等算法 这里我们先来理清楚神经网络的步骤 (1) 构建数据.我们要构建出这样的一个数据,sh

基于深度神经网络的病理嗓音研究

实现过程: 一:关于病理嗓音的特征提取,这里分析的是嗓音疾病,而不是去分析所有疾病. 二:基于深度神经网络病理嗓音分类, 对嗓音病理性质进行分类,以及对嗓音疾病的严重程度进行分类. 相关的预备知识: 1.关于声音和嗓音形成的基本原理: 声音产生的本质是振动,物体的振动力度越大,响度越大:振动的频率越高,音调越高:不同物体发出的声音是不一样的,这取决于音色.人能听到声音的前提是音调在20到20000Hz,并且响度在一个范围内.这里有个问题,生活中我们常说一个人的声音太小了,听不见,这里指的是响度,

深度神经网络可视化工具集锦

深度神经网络可视化工具集锦 雷锋网按:原文作者zhwhong,载于作者的个人博客,雷锋网(公众号:雷锋网)经授权发布.  TensorBoard:TensorFlow集成可视化工具 GitHub官方项目:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/tensorboard TensorBoard 涉及到的运算,通常是在训练庞大的深度神经网络中出现的复杂而又难以理解的运算. 为了更方便 TensorFlow 程序的理