深度学习用于文本分类的论文及代码集锦

深度学习用于文本分类的论文及代码集锦

原创： FrankLearningMachine 机器学习blog 4天前

[1] Convolutional Neural Networks for Sentence Classification

Yoon Kim

New York University

EMNLP 2014

http://www.aclweb.org/anthology/D14-1181

这篇文章主要利用CNN基于预训练好的词向量中对句子进行分类。作者发现利用微调来学习任务相关的词向量可以提升模型效果。

网络结构示例如下

各个数据集统计信息如下

各模型结果对比如下

a

通道对模型结果影响示例如下

代码地址

https://github.com/yoonkim/CNN_sentence (Theano)

https://github.com/dennybritz/cnn-text-classification-tf (Tensorflow)

https://github.com/harvardnlp/sent-conv-torch (Torch)

相关研究组

http://nlp.seas.harvard.edu/ (哈佛大学)

我是分割线

[2] A Convolutional Neural Network for Modelling Sentences

Nal Kalchbrenner

University of Oxford

ACL 2014

http://www.aclweb.org/anthology/P14-1062

这篇文章提出一种动态卷积神经网络，并将其用于句子中的语义建模。该网络中的池化算子为动态k最大池化法，该算子用于线性序列。本文中的网络可以处理变长的句子，并对句子推理出特征图，该特征图不仅可以捕获短距离关系，也可以捕获长距离关系。另外，该网络不依赖解析树，可以用于任何种类的语言。

网络结构示例如下

宽窄卷积对比如下

整体结构如下

各模型结果对比如下

模型结果示例如下

代码地址

https://github.com/FredericGodin/DynamicCNN (Theano/Lasagne)

我是分割线

[3] Character-level Convolutional Networks for Text Classification

Xiang Zhang et al.

NIPS 2015

https://papers.nips.cc/paper/5782-character-level-convolutional-networks-for-text-classification.pdf

这篇文章主要讨论字符级别的卷积神经网络。

模型结构示例如下

卷积层示例如下

全连接层示例如下

数据集统计信息如下

各模型结果对比如下

代码地址

https://github.com/zhangxiangxiao/Crepe （Torch）

https://github.com/mhjabreel/CharCNN (Tensorflow)

https://github.com/srviest/char-cnn-text-classification-pytorch (PyTorch)

我是分割线

[4] Hierarchical Attention Networks for Document Classification

Zichao Yang et al.

Carnegie Mellon University, Microsoft Research

NAACL-HLT 2016

http://www.aclweb.org/anthology/N16-1174

这篇文章提出分层注意力网络用于文档分类。该模型的分层结构可以对应到文档的分层结构；该网络的注意力机制包含单词级别和句子级别的两种注意力机制，这有助于发现文档中的重要内容。

分层注意力网络结构如下

数据集统计信息如下

各方法结果对比如下

代码地址

https://github.com/richliao/textClassifier (keras)

https://github.com/ematvey/hierarchical-attention-networks (Tensorflow)

https://github.com/EdGENetworks/attention-networks-for-classification (Pytorch)

我是分割线

[5] Recurrent Convolutional Neural Networks for Text Classification

Siwei Lai et al.

Chinese Academy of Sciences

AAAI 2015

https://www.aaai.org/ocs/index.php/AAAI/AAAI15/paper/viewFile/9745/9552

这篇文章提出循环卷积神经网络用于文本分类，无需人工设计特征。循环结构用于捕捉上下文信息，该结构相对传统基于窗口的神经网络方法可以减少噪声。该文中利用最大值池化法来自动选择文本中比较重要的词，使其对文本分类作用较大。

网络结构示例如下

数据集统计信息如下

各方法效果对比如下

上下文窗口大小影响示例如下

代码地址

https://github.com/airalcorn2/Recurrent-Convolutional-Neural-Network-Text-Classifier (Keras)

我是分割线

[6] Very Deep Convolutional Networks for Text Classification

Alexis Conneau et al.

Facebook AI Research

ACL 2017

http://www.aclweb.org/anthology/E17-1104

这篇文章利用VDCNN在字符级别上处理文本，并且卷积和池化算子都比较小，即所依赖的单元数较少。该文中利用了29个卷积层。

样本及标签示例如下

网络结构如下

其中卷积块结构如下

各卷积块对应的卷积层数如下

数据集统计信息如下

各方法效果对比如下

代码地址

https://github.com/geduo15/Very-Deep-Convolutional-Networks-for-Natural-Language-Processing-in-tensorflow （TensorFlow）

https://github.com/zonetrooper32/VDCNN （TensorFlow keras）

我是分割线

[7] Do Convolutional Networks Need to Be Deep for Text Classification?

Hoa T. Le et al.

LORIA

AAAI 2018

https://aaai.org/ocs/index.php/WS/AAAIW18/paper/viewFile/16578/15542

这篇文章讨论了文本分类中卷积网络的深度的重要性。

浅宽卷积神经网络示例

字符级别的DenseNet示例如下

Dense Block 示例如下

各模型效果对比如下

数据集统计信息如下

代码地址

https://github.com/lethienhoa/Very-Deep-Convolutional-Networks-for-Natural-Language-Processing (Tensorflow)

原文地址：https://www.cnblogs.com/timxgb/p/9818629.html

时间： 2024-09-30 22:43:04

深度学习用于文本分类的论文及代码集锦的相关文章

将迁移学习用于文本分类《 Universal Language Model Fine-tuning for Text Classification》

将迁移学习用于文本分类 < Universal Language Model Fine-tuning for Text Classification> 2018-07-27 20:07:43 ttv56 阅读数 4552更多分类专栏: 自然语言处理版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/u014475479/article/details/81253506 本文发表于自然语言

针对深度学习的文本分类模型盘点

1.textCNN 优势:短文本分类可参照:https://www.cnblogs.com/AntonioSu/p/11969386.html 2.fast Text 优点:训练速度快 3.HAN(Hierarchical Attention Network) 优点:对文档的分类双向的LSTM,可以获得丰富的词汇表示 attention阶段:词在句子中的重要程度 4.Transformer 可参考:https://www.cnblogs.com/AntonioSu/p/12019534.ht

用于文本分类的RNN-Attention网络

用于文本分类的RNN-Attention网络 https://blog.csdn.net/thriving_fcl/article/details/73381217 Attention机制在NLP上最早是被用于seq2seq的翻译类任务中,如Neural Machine Translation by Jointly Learning to Align and Translate这篇文章所说. 之后在文本分类的任务中也用上Attention机制,这篇博客主要介绍Attention机制在文本分类任务

深度学习目标检测算法 SSD 论文简介

深度学习目标检测算法 SSD 论文简介一.论文简介: ECCV-2016 Paper:https://arxiv.org/pdf/1512.02325v5.pdf Slides:http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf 二.代码训练测试: https://github.com/weiliu89/caffe/tree/ssd 一.论文算法大致流程: 1.类似"anchor"机制: 如上所示:在 featur

深度学习遥感影像分类(1)_数据集批量准备

近年来,深度学习在遥感影像地物分类中取得了一系列显著的效果.CNN可以很好的获取影像纹理信息,捕捉像素与像素之间的空间特征,因此,一个训练好的深度学习模型在地物提取中具有很大的优势.但模型的训练却是一个很繁琐的任务,需要人工准备数据集,贴标签,训练模型等.本文将以sar影像为例实现冰水二分类的数据集批量准备工作(划线取点截取小图片保存): 1.原始sar遥感影像 2.预处理思路: a.人工划线:对应在冰和水上画n条线(自己设置,注意自己需要针对类别所占比例控制线条数量和长度) b.保存小图片:获

基于的朴素贝叶斯的文本分类（附完整代码(spark/java）

本文主要包括以下内容: 1)模型训练数据生成(demo) 2 ) 模型训练(spark+java),数据存储在hdfs上 3)预测数据生成(demo) 4)使用生成的模型进行文本分类. 一.训练数据生成 spark mllib模型训练的输入数据格式通常有两种,一种叫做 LIBSVM 格式,样式如下: label index1:value1 index2:value2 label为类别标签,indexX为特征向量索引下标,value为对应的那维的取值. 另一种格式样式如下: label f1,f2

Google深度学习笔记文本与序列的深度模型

Deep Models for Text and Sequence 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程地址视频/字幕下载 Rare Event 与其他机器学习不同,在文本分析里,陌生的东西(rare event)往往是最重要的,而最常见的东西往往是最不重要的. 语法多义性一个东西可能有多个名字,对这种related文本能够做参数共享是最好的需要识别单

在ubuntu中配置深度学习python图片分类实验环境

1 安装numpy,scipy, matplotlib, sudo apt-get install python-numpy sudo apt-get install python-scipy sudo apt-get install python-matplotlibsudo apt-get install python-dev 2 图片处理相关的科学库 pip install scikit-image

深度学习之卷积神经网络CNN及tensorflow代码实现示例

一.CNN的引入在人工的全连接神经网络中,每相邻两层之间的每个神经元之间都是有边相连的.当输入层的特征维度变得很高时,这时全连接网络需要训练的参数就会增大很多,计算速度就会变得很慢,例如一张黑白的 28×28 的手写数字图片,输入层的神经元就有784个,如下图所示: 若在中间只使用一层隐藏层,参数 w 就有 784×15=11760 多个:若输入的是28×28 带有颜色的RGB格式的手写数字图片,输入神经元就有28×28×3=2352 个-- .这很容易看出使用全连接神经网络处理图像中的需要训

猜你喜欢

只授权看和写两个权限第一步:进入设置界面[[email protected]~]# vimsudo 第二步:设置一定的权限 root ALL=(ALL) ALL ...

Bzoj3196 Tyvj 1730 二逼平衡树

Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 3350 Solved: 1324 Description 您需要写一种数据结构(可参考题目标题),来 ...

记一次 PHP调用Java Webservice

前两天,第三方合作公司给我们一个Webservice的链接,说是Java做的,里面有个sendMsg()方法,让我们在用php做的项目里推送消息给他们.我们公司是有用.net做的Webservice, ...

创业街指导：新手创业一定要注意防骗

随着创业人数的不断增加,创业的骗局也随之增加.对于初次创业者来说,如何防骗很重要.创业者在投资加盟的时候,一定要多考察,多看看,多对比,这样才能避免盲目的投资为你带来后悔.下面创业街为大家说说有哪些容 ...

HTTP协议学习笔记

一.web及网络基础 TCP/IP分层管理应用层——传输层——网络层——链路层 TCP/IP通信传输流想浏览http://www.xxx.com/aaa/页面,客户端(浏览器)请求DNS服务,得到 ...

Html（3）——常见的表单元素

一个文件下载接口引发的血案Content-Disposition之殇

今天在迁移一个老系统到新服务器的时候,在测试下载接口的时候发现:同一个接口,有些文件可以下载,有些文件不能下载. 调试了半天发现,好像是文件名的问题. string fileName = " ...

第二节：指令的使用（5）

1.v-pre 编译的时候跳过当前的元素和它的子元素.可以用来显示原始的Mustache标签.跳过大量没有指令的标签会加快编译. <span v-pre>{{ this will not ...

课堂收获：案例

package com.hanqi; public class Car { //品牌 private String pinP; // 读 public String getPinP() { retur ...

对spring默认的单列模式的理解

我想大部分朋友对spring的单例模式都比较了解.什么叫单例模式呢,顾名思义就是不管有多少个请求,都只生成一个实例. 比如在spring中a,b请求都在调用相同的bean ,他们都是调用的同一个bea ...

Eclipse——如何设置代码字体大小

eclipse默认字体太小,1920*1080下分辨不清楚,接下来介绍一下如何更改默认字体大小: 1.window-Preferences 2.General-Appearance-Colors an ...

谈团队建设之一: 旁观者效应

旁观者效应参见维基百科,是一个社会心理学术语,在紧急情况下,个体在有人在场时,出手帮助的可能性降低,援助的几率与旁观者人数成反比.换句话说,旁观者数量越多,他们当中任何一人进行援助的可能性越低. 其 ...

的是个大概价格是国家级高速加工及计算机

http://www.goyelang.com/files/article/html/8/8307/2493822.html http://dwz.cn/1hfWmK http://www.goyel ...

UVa 247 电话圈（Floyd传递闭包）

https://vjudge.net/problem/UVA-247 题意: 如果两个人相互打电话,则说他们在同一个电话圈里.例如,a打给b,b打给c,c打给d,d打给a,则这4个人在同一个圈里:如果 ...

Node.js上传文件

var formidable = require('formidable'); var util = require('util'); exports.upload = function(req,re ...

java 散列与散列码探讨 ,简单HashMap实现散列映射表执行各种操作示列

package org.rui.collection2.maps; /** * 散列与散列码 * 将土拔鼠对象与预报对象联系起来, * @author lenovo * */ //土拨鼠 public ...

Django中的Form（二）

一.保存用户输入内容如果用户输入一张表单提交后出现错误时,会出现重现填写的情况.我们可以把用户输入的信息保存下来,并返回到前台页面,这样用户就无需再次输入. views.py 1 # coding: ...

spring 注解注入属性和注解完成bean定义

1. 使用 @Autowired 和 @Resource 注解来注入属性 2. 使用 @Component.@Repository.@Service.@Controller 注解,就将该类定义为一个B ...

A Look at the Razor View Engine in ASP.NET MVC

The biggest architectural difference that exists between ASP.NET MVC and ASP.NET Web Forms is the ne ...

Minecraft InputFix

环境 MCP&eclipse InPutFix在MCP中的源码位置:net.minecraft.gui.GuiScreen InPutFix源码 public void handleKeyb ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.