26 seq2seq model

前面有提到 seq2seq model,我們就從這邊開始。

Seq2seq model 他採用了 encoder-decoder 架構,這時候就要來點 paper 的圖啦!

在以往的 language model 的作法裡,會是把一個 word 塞進 RNN 裡,那麼 RNN 就會立刻吐出一個相對應的 word 出來。

像是放進一個英文字,會吐出一個相對應的法文字,然後將這一層的預測結果帶給下一層。

這麼做雖然很直覺,但是他並不能完整的翻譯一個句子。

語言的語法各不相同,所以很難將詞語一一對映做成 大专栏  26 seq2seq model翻譯。

這個 seq2seq model 採用了不同的作法,將一組 LSTM 作為 encoder,負責將要翻譯的句子轉換成固定長度的向量,再將這個向量交給另一個 LSTM 轉換成目標句子,後面這個 LSTM 就是 decoder 的角色。

這樣的架構之下將一個模型拆成 encoder 跟 decoder 的兩個部份,讓兩個部份都可以各自接受或是產生不同長度的句子,並且得到很好的分數。

在實作上,的確是將兩個 LSTM 接起來,所以就沒什麼細節好講的。

但是這個模型確實的解決了以不同長度的句子產生不同長度的句子的問題。

原文地址:https://www.cnblogs.com/sanxiandoupi/p/11711020.html

时间: 2024-11-14 14:32:30

26 seq2seq model的相关文章

keras系列︱seq2seq系列相关实现与案例(feedback、peek、attention类型)

之前在看<Semi-supervised Sequence Learning>这篇文章的时候对seq2seq半监督的方式做文本分类的方式产生了一定兴趣,于是开始简单研究了seq2seq.先来简单说一下这篇paper的内容: 创立的新形式Sequence AutoEncoder LSTM(SA-LSTM),Pre-trained RNNs are more stable, generalize better, and achieve state-of-the-art results on var

ecmall中static变量的使用-model模型代码设计

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 function &m($model_name, $params = array(), $is_new = false) {     <span style="backg

在使用Pipeline串联多个stage时model和非model的区别

train.csv数据: id,name,age,sex1,lyy,20,F2,rdd,20,M3,nyc,18,M4,mzy,10,M 数据读取: 1 SparkSession spark = SparkSession.builder().enableHiveSupport() 2 .getOrCreate(); 3 Dataset<Row> dataset = spark 4 .read() 5 .format("org.apache.spark.sql.execution.da

iOS xml解析

iOS xml 解析方法有两种:SAX , DOM. SAX 不用借助第三方,在解析过程中逐行解析.(NSXMLParser,需要实现代理),具体步骤: 1.获取文件路径. 2.创建 NSXMLParser 对象. 3.遵守协议,设置代理. 4.实现代理方法 1>- (void)parserDidStartDocument:  ---- 开始解析 2>- (void)parserDidEndDocument: ----解析结束 3>- (void)parser:didStartEleme

ASP.NET Core实现OAuth2.0的AuthorizationCode模式

ASP.NET Core实现OAuth2的AuthorizationCode模式 授权服务器 Program.cs --> Main方法中:需要调用UseUrls设置IdentityServer4授权服务的IP地址 1             var host = new WebHostBuilder()2                 .UseKestrel()3                 //IdentityServer4的使用需要配置UseUrls4                

ORM框架(ITDOS实战源码)

ORM提供了实现持久化层的另一种模式,它采用映射元数据来描述对象关系的映射,使得ORM中间件能在任何一个应用的业务逻辑层和数据库层之间充当桥梁. 如以下示例: 1 public int GetSystemAccreditMessageInfo(AccreditParam param) 2 { 3 var where = new Where<User>(); 4 var countMesage = 0;//记录提醒次数 5 HttpCookie cookie = HttpContext.Curr

ERP客户关系渠管理(二十)

渠道的需求: 用力图: 渠道对应客户关系的意义? 渠道是指产品从生产出来到终端消费的流通环节. 添加的存储过程: ALTER PROCEDURE [dbo].[BioErpCrmManageChannel_ADD] @ChannelID int output, @UserID int, @SuperiorChannel int, @ChannelName nvarchar(50), @Tel1 nvarchar(20), @Tel2 nvarchar(20), @Fax nvarchar(20)

公众号微信支付

1.概要 公众号是以微信用户的一个联系人形式存在的,支付是微信服务号的核心一环. 本篇主要介绍微信支付这一功能,避免大家再跳微信支付的坑. 1.1 关于Magicodes.WeChat.SDK MAGICODES.WECHAT.SDK为心莱团队封装的轻量级微信SDK,现已全部开源,开源库地址为:https://github.com/xin-lai/Magicodes.WeChat.SDK 更多介绍,请关注后续博客. 2.微信公众号支付 用户已有商城网址,用户通过微信消息.微信扫描二维码.微信自定

GridView控件相关2

---恢复内容开始--- 此文档主要侧重---GridView控件上的 [更新] 和 [删除] 两个事件的具体操作: 1.在非编辑状态,如何取出[BoundField]模板中的绑定值: string s = GridView1.Rows[2].Cells[0].Text; 在编辑状态下,如何取出GridView中用[BouldField]绑定的内容------即,如何获得[TextBox]中用户输入的内容: ((TextBox)GridView1.Rows[2].Cells[0].Control