文本生成论文集

论文0

题目《Generating Text with Recurrent Neural Networks》

解决问题：（1）句子压缩（2）文本生成

要点：

（1）提出了新的rnn结构（MRNN）

本文表示能够提升文本生成能力，但名气比较小

论文1

题目《Generating Sequences With Recurrent Neural Networks

》

代码：https://sourceforge.net/projects/rnnl/

文本自动生成任务

网络结构：

特点：

（1）这个网络在输入节点和所有隐层节点、所有隐层节点和输出节点之间都有连接，这样做的好处是更加方便的训练deep network。

（2）隐层单元该网络采用了LSTM单元。

（3）采用char-level language modeling，缩小解空间

（4）在模型训练时，输入数据切成100个bype为单元的sequence，但是模型的隐状态每100个sequence才复位，也就是实际的训练序列长度为10000个byte，也就是训练了整个文本。

论文2

题目《Globally Coherent Text Generation with Neural Checklist Models》

特点：菜谱生成的例子，预先提供关键词

论文3

题目《Semantically Conditioned LSTM-based Natural Language Generation for Spoken Dialogue Systems》

论文4

题目《SENTENCE ORDERING USING RECURRENT NEURAL NETWORKS》

要点：句子通顺度排序

论文5

题目《Backward and Forward Language Modeling for Constrained Sentence Generation》

要点：词汇限定条件下的文本生成

论文6

题目《Generating Topical Poetry》

要点：特定主题下的诗歌生成

论文7

题目《A Planning based Framework for Essay Generation》

要点：特定主题下的文章生成，比较贴近需求，但是没有用rnn的方法，通顺度存疑

解决问题的框架：

（1）topic understanding

（2）sentence extraction

（3）sentence reordering

论文8

题目《Controllable Text Generation》

要点：难度大

论文9

题目：《Survey of the State of the Art in Natural Language Generation: Core tasks, applications and evaluation》

要点：综述

论文10

题目《Generating Text from Structured Data with Application to the Biography Domain》

要点：从concept到文章

数据集：https://github.com/rlebret/wikipedia-biography-dataset

解决问题的框架：

（1）table data转换成embedding

（2）只生成一句话百科，长度比较短

论文11

题目《Context-aware Natural Language Generation with Recurrent Neural Networks》

由机器生成评论

网络结构：

（1）Encoder采用全连接方式编码Context信息

（2）Decoder采用RNN

采用lstm为cell，为了解决长句子词越到后面越难以控制的问题，引入gate机制，控制每个词与hidden vector相关

论文12

题目《Generating sentences from a continuous space》

refs:

(1) http://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/

(2) 亚马逊评论数据集, http://jmcauley.ucsd.edu/data/amazon/links.html

时间： 2024-12-10 22:53:40

文本生成论文集的相关文章

使用TextRank算法为文本生成关键字和摘要

TextRank算法基于PageRank,用于为文本生成关键字和摘要.其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004. 先从PageRank讲起. PageRank PageRank最开始用来计算网页的重要性.整个www可以看作一张有向图图,节点是网页.如果网页A存在到网页B的链接,那么有一条从网页A指向网页B的有向

Python将文本生成二维码

#coding:utf-8 ''' Python生成二维码 v1.0 主要将文本生成二维码图片测试一:将文本生成白底黑字的二维码图片测试二:将文本生成带logo的二维码图片 ''' __author__ = 'Xue' import qrcode from PIL import Image import os #生成二维码图片 def make_qr(str,save): qr=qrcode.QRCode( version=4, #生成二维码尺寸的大小 1-40 1:21*21(21+(n-

Texygen文本生成,交大计算机系14级的朱耀明

文本生成哪家强?上交大提出基准测试新平台 Texygen 2018-02-12 13:11测评新智元报道来源:arxiv 编译:Marvin [新智元导读]上海交通大学.伦敦大学学院朱耀明, 卢思迪,郑雷,郭家贤, 张伟楠, 汪军,俞勇等人的研究团队最新推出Texygen平台,这是一个支持开放域文本生成模型研究的基准平台.Texygen不仅实现了大部分的文本生成模型,而且还覆盖了一系列衡量生成文本的多样性.质量和一致性的评测指标. 项目地址: https://github.com/geek-

python根据文本生成词云图

python根据文本生成词云图效果代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as analyse from scipy.misc import imread import os from os import path import matplotlib.pyplot as plt from PIL import Image, ImageDraw, ImageFont

Pytorch——GPT-2 预训练模型及文本生成

介绍在本次将学习另一个有着优秀表现的预训练模型:GPT-2 模型,以及使用它进行文本生成任务实践. 知识点 GPT-2 的核心思想 GPT-2 模型结构详解 GPT-2 进行文本生成 OpenAI 在论文 Improving Language Understanding by Generative Pre-Training 中提出了 GPT 模型.GPT 模型是由单向 Transformer 的解码器构建的模型,OpenAI 团队在一个非常大的书籍数据集 the Toronto Book Co

走进生成对抗式网络（GAN）摘记

自从OpenAI的Ian J.Goodfellow大神发的开创性文章GAN以后,GAN的发展是膨胀式的,工业界的各个大牛也随之加入GAN蓬勃发展的大军中.除了OpenAI之外,工业界好多公司都参与到了GAN的研究中,包括了Facebook.Google.Apple等公司.其中一个发表比较的多的就是Facebook的Soumith Chintala,他参与发表了DCGAN.LPGAN.WGAN以及SSGAN,其中WGAN也是得到了大量的关注,该文详细的对GAN的缺陷进行了深入解析,然后提出了具有里

[原创]牛刀小试-重构并实现邮件内容生成功能

案例近期团队中多个项目均有邮件发送功能,邮件内容采用html格式,各项目独立开发,无统一实现方案. 举例: 某类型EmailSendService 类型拥有多个String字段 content1.content2 ... content7,均为html文本生成邮件内容直接使用字符串连接 context1 + userName + content2 + inviteCode + content3 + money + content4 + year + content5 + month + co

iOS中二维码的生成与使用（入门篇）

这里简单总结一下关于二维码的扫描与生成,用的是原生的AVFoundation框架,其实这个框架目前功能还是够用的,不过这里推荐一个二维码扫描的第三方(face++),网址就不贴了,直接度娘就OK,里面的内容足够丰富,感兴趣的朋友可以自己去倒弄一下. 一.二维码的扫描步骤: 1.创建输入视频设备(默认是后置摄像头) 2.创建输入设备对象 3.创建元数据输出设备 4.创建session目的是将输入和输出联系在一起) 5.把输出设备添加到session,将输入设备添加到session 6.设置数据源

JSON数据的生成与解析

JSON数据的生成与解析,首先先到网上下载一个json jar包,我用的是org.json 示例代码: package json; import org.json.JSONArray; import org.json.JSONObject; public class Main { /** * 生成Json数据 */ public static String createJson(){ JSONObject json = new JSONObject(); json.put("classId&qu