文本生成论文集

文本生成论文集

论文0

题目《Generating Text with Recurrent Neural Networks》

解决问题:(1)句子压缩(2)文本生成

要点:

(1)提出了新的rnn结构(MRNN)

本文表示能够提升文本生成能力,但名气比较小

论文1

题目《Generating Sequences With Recurrent Neural Networks

代码:https://sourceforge.net/projects/rnnl/

文本自动生成任务

网络结构:

特点:

(1)这个网络在输入节点和所有隐层节点、所有隐层节点和输出节点之间都有连接,这样做的好处是更加方便的训练deep network。

(2)隐层单元该网络采用了LSTM单元。

(3)采用char-level language modeling,缩小解空间

(4)在模型训练时,输入数据切成100个bype为单元的sequence,但是模型的隐状态每100个sequence才复位,也就是实际的训练序列长度为10000个byte,也就是训练了整个文本。

论文2

题目《Globally Coherent Text Generation with Neural Checklist Models》

特点:菜谱生成的例子,预先提供关键词

论文3

题目《Semantically Conditioned LSTM-based Natural Language Generation for Spoken Dialogue Systems》

论文4

题目《SENTENCE ORDERING USING RECURRENT NEURAL NETWORKS》

要点:句子通顺度排序

论文5

题目《Backward and Forward Language Modeling for Constrained Sentence Generation》

要点:词汇限定条件下的文本生成

论文6

题目《Generating Topical Poetry》

要点:特定主题下的诗歌生成

论文7

题目《A Planning based Framework for Essay Generation》

要点:特定主题下的文章生成,比较贴近需求,但是没有用rnn的方法,通顺度存疑

解决问题的框架:

(1)topic understanding

(2)sentence extraction

(3)sentence reordering

论文8

题目《Controllable Text Generation》

要点:难度大

论文9

题目:《Survey of the State of the Art in Natural Language Generation: Core tasks, applications and evaluation》

要点:综述

论文10

题目《Generating Text from Structured Data with Application to the Biography Domain》

要点:从concept到文章

数据集:https://github.com/rlebret/wikipedia-biography-dataset

解决问题的框架:

(1)table data转换成embedding

(2)只生成一句话百科,长度比较短

论文11

题目《Context-aware Natural Language Generation with Recurrent Neural Networks》

由机器生成评论

网络结构:

(1)Encoder采用全连接方式编码Context信息

(2)Decoder采用RNN

采用lstm为cell,为了解决长句子词越到后面越难以控制的问题,引入gate机制,控制每个词与hidden vector相关

论文12

题目《Generating sentences from a continuous space》

refs:

(1) http://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/

(2) 亚马逊评论数据集, http://jmcauley.ucsd.edu/data/amazon/links.html

时间: 2024-10-10 09:43:02

文本生成论文集的相关文章

使用TextRank算法为文本生成关键字和摘要

TextRank算法基于PageRank,用于为文本生成关键字和摘要.其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004. 先从PageRank讲起. PageRank PageRank最开始用来计算网页的重要性.整个www可以看作一张有向图图,节点是网页.如果网页A存在到网页B的链接,那么有一条从网页A指向网页B的有向

Python将文本生成二维码

#coding:utf-8 ''' Python生成二维码 v1.0 主要将文本生成二维码图片 测试一:将文本生成白底黑字的二维码图片 测试二:将文本生成带logo的二维码图片 ''' __author__ = 'Xue' import qrcode from PIL import Image import os #生成二维码图片 def make_qr(str,save): qr=qrcode.QRCode( version=4, #生成二维码尺寸的大小 1-40 1:21*21(21+(n-

Texygen文本生成,交大计算机系14级的朱耀明

文本生成哪家强?上交大提出基准测试新平台 Texygen 2018-02-12 13:11测评 新智元报道 来源:arxiv 编译:Marvin [新智元导读]上海交通大学.伦敦大学学院朱耀明, 卢思迪,郑雷,郭家贤, 张伟楠, 汪军,俞勇等人的研究团队最新推出Texygen平台,这是一个支持开放域文本生成模型研究的基准平台.Texygen不仅实现了大部分的文本生成模型,而且还覆盖了一系列衡量生成文本的多样性.质量和一致性的评测指标. 项目地址: https://github.com/geek-

python根据文本生成词云图

python根据文本生成词云图 效果 代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as analyse from scipy.misc import imread import os from os import path import matplotlib.pyplot as plt from PIL import Image, ImageDraw, ImageFont

Pytorch——GPT-2 预训练模型及文本生成

介绍 在本次将学习另一个有着优秀表现的预训练模型:GPT-2 模型,以及使用它进行文本生成任务实践. 知识点 GPT-2 的核心思想 GPT-2 模型结构详解 GPT-2 进行文本生成 OpenAI 在论文 Improving Language Understanding by Generative Pre-Training 中提出了 GPT 模型.GPT 模型是由单向 Transformer 的解码器构建的模型,OpenAI 团队在一个非常大的书籍数据集 the Toronto Book Co

走进生成对抗式网络(GAN)摘记

自从OpenAI的Ian J.Goodfellow大神发的开创性文章GAN以后,GAN的发展是膨胀式的,工业界的各个大牛也随之加入GAN蓬勃发展的大军中.除了OpenAI之外,工业界好多公司都参与到了GAN的研究中,包括了Facebook.Google.Apple等公司.其中一个发表比较的多的就是Facebook的Soumith Chintala,他参与发表了DCGAN.LPGAN.WGAN以及SSGAN,其中WGAN也是得到了大量的关注,该文详细的对GAN的缺陷进行了深入解析,然后提出了具有里

[原创]牛刀小试-重构并实现邮件内容生成功能

案例 近期团队中多个项目均有邮件发送功能,邮件内容采用html格式,各项目独立开发,无统一实现方案. 举例: 某类型EmailSendService 类型拥有多个String字段 content1.content2 ... content7,均为html文本 生成邮件内容直接使用字符串连接 context1 + userName + content2 + inviteCode + content3 + money + content4 + year + content5 + month + co

iOS中二维码的生成与使用(入门篇)

这里简单总结一下关于二维码的扫描与生成,用的是原生的AVFoundation框架,其实这个框架目前功能还是够用的,不过这里推荐一个二维码扫描的第三方(face++),网址就不贴了,直接度娘就OK,里面的内容足够丰富,感兴趣的朋友可以自己去倒弄一下. 一.二维码的扫描 步骤: 1.创建输入视频设备(默认是后置摄像头) 2.创建输入设备对象 3.创建元数据输出设备 4.创建session目的是将输入和输出联系在一起) 5.把输出设备添加到session,将输入设备添加到session 6.设置数据源

JSON数据的生成与解析

JSON数据的生成与解析,首先先到网上下载一个json jar包,我用的是org.json 示例代码: package json; import org.json.JSONArray; import org.json.JSONObject; public class Main { /** * 生成Json数据 */ public static String createJson(){ JSONObject json = new JSONObject(); json.put("classId&qu