Sebastian Ruder : NLP 领域知名博主博士论文面向自然语言处理的神经网络迁移学习

Sebastian Ruder 博士的答辩 PPT《Neural Transfer Learning for Natural Language Processing》介绍了面向自然语言的迁移学习的动机、研究现状、缺陷以及自己的工作。

Sebastian Ruder 博士在 PPT 中阐述了使用迁移学习的动机:

state-of-the-art 的有监督学习算法比较脆弱:

易受到对抗样本的影响

易受到噪音数据的影响

易受到释义的影响

现实中的自然语言处理面临着多领域、多语种上的多种类型的任务,为每个任务都单独进行数据标注是不大可行的,而迁移学习可以将学习的知识迁移到相关的场景下

许多基础的前沿的 NLP 技术都可以被看成是迁移学习:

潜在语义分析 (Latent semantic analysis)

Brown clusters

预训练词向量(Pretrained word embeddings)

已有的迁移学习方法往往有着下面的局限性:

过度约束:预定义的相似度指标,硬参数共享

设置定制化:在一个任务上进行评价,任务级别的共享策略

弱 baseline:缺少和传统方法的对比

脆弱:在领域外表现很差,依赖语种、任务的相似性

低效:需要更多的参数、时间和样本

因此,作者认为研究迁移学习需要解决下面的这些问题:

克服源和目标之间的差距

引起归纳偏置

结合传统和现有的方法

在 NLP 任务中跨层次迁移

泛化设置

作者围绕迁移学习做了 4 个方面的工作:

领域适应(Domain Adaption)

跨语种学习(Cross-lingual learning)

多任务学习(Multi-task learning)

序列迁移学习(Sequential transfer learning)

具体内容可在 Sebastian Ruder 博士的完整答辩 PPT 中查看。

原文地址:https://www.cnblogs.com/alan-blog-TsingHua/p/10611932.html

时间: 2024-10-06 20:31:14

Sebastian Ruder : NLP 领域知名博主博士论文面向自然语言处理的神经网络迁移学习的相关文章

博主整理

Name Introduction 纯洁的微笑 资深码农博主,对Spring框架的总结非常不错,现在在一家互联网金融公司做技术经理兼技术负责人 Raysmond 复旦的计算机研究生,现在在北京工作,生活很精彩,工程能力也非常强,看到他在与我同龄时写的一些代码,非常佩服 Yikun 西电毕业的通信领域研究生,去年好像去了菊厂,手绘很棒,生活也很精彩,也是个技术牛人 酷壳 耗子叔,业内知名博主,每一篇博文都是经典,15年开发经验的老码农,曾在Amazon,阿里等处做过资深专家 王之琳 12年本科毕业

关于大数据领域各个组件打包部署到集群运行的总结(含手动和maven)(博主推荐)

对于这里的打包,总结: (1)     最简单的,也是为了适应公司里,还是要用maven,当然spark那边sbt,maven都可以.但是maven居多. Eclipse/MyEclipse下如何Maven管理多个Mapreduce程序?(企业级水平) IDEA里如何多种方式打jar包,然后上传到集群 Spark编程环境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(博主强烈推荐) (2)     将整个项目打jar包进去,只需指定

博主全程打造的第一个亲生儿子---朴素农历(free)

先上几张王道: App Store 下载地址 越狱版下载地址 虽然博主从2013年开始开发iOS,但是那时候仅仅是为别人打工,写APP. 第一个儿子是ShortenMe+,可能没什么人知道这个软件吧,它是博主独自打造的一款图片处理小App 但是因为那时候Too young,too simple!基础知识太薄弱,图片处理的效果并不理想.而且TA是在美国区上线的···so,下载量并不是很多 更因为发布者是我那时候的老板!!!所以,对别人而言,我是把儿子过继给他了!!! 博主第二个儿子是一款Googl

全网最详细的Eclipse和MyEclipse里对于Java web项目发布到Tomcat上运行成功的对比事宜【博主强烈推荐】【适合普通的还是Maven方式创建的】(图文详解)

不多说,直接上干货! 首先,大家要明确,IDEA.Eclipse和MyEclipse等编辑器之间的新建和运行手法是不一样的. 全网最详细的Eclipse里如何正确新建普通的Java web项目并发布到Tomcat上运行成功[博主强烈推荐](图文详解) Eclipse是 或者 MyEclipse是 由 变成 即,只有所框的部分过去了.并且自动改名为dat08. 用MyEclipse里自带的Web Browser检测: 用第三方安装的浏览器检测: 欢迎大家,加入我的微信公众号:大数据躺过的坑   

博主个人介绍chrome-live-writer

博主个人介绍 1   联系方式 姓名:Harmo(哈莫) Email:[email protected] QQ:1295351490 2   个人信息 哈莫/男/198* 本科:WHU 研究生:WHU 工作年限:3年 技术博客:http://www.cnblogs.com/beer Github:http://github.com/zhengwh 个人职业技能及规划 软件测试开发 测试系统开发 软件质量保证 开发流程规范 工作和生活城市:武汉 3   技能清单 3.1   英语技能 求学阶段通过

随便写写~~ 与同我一样初学JavaScript的博主们共勉

集中精力学习JavaScript有一个月了,现在过年放假在家有时间决定把之前学过的基础知识都复习总结一遍.想放到这里一方面方便今后查阅:另一方面真心希望看到我文章的各位博主给予指点. 大一时在学校接触过一点,之后的工作中用不到,可以说是一个初学者.为了集中精力学习同时也给自己放个假,辞职报班学习.因为之前的单位做网站建设,接触静态页面的机会很多.我只报了JS班,这样课下有时间我就自学HTML和CSS练习切图写静态页面.一步一步来,心急也没用的.2015年我很期待去找个新工作,融入新的工作环境,认

博主自传——蒟蒻的OI之路

博主来自河北石家庄市第二中学,现在读高二,主攻信息学竞赛(其实并没有学习其他学科竞赛). NOIP中人品大爆发,使劲挤进河北省一等奖队伍,侥幸留在竞赛团队中(差点就淘汰出局啦). 关于我的ID,YOUSIKI,就是那四个平假名,没有什么实际意义.若搜到日本某艺人,和我无关. NOIP前主要活跃在PekingUniversityOnlineJudge(不知道拼错木有),现在主要活跃在Lydsy(小伙伴们都叫他BZOJ). 在各个OJ上基本都有号(有大号也有小号),ID都是YOUSIKI.Tyvj,

【博主福利】博文保存草稿丢失怎么办?

近来小编收到很多收到很多博主的反馈: "编辑器太难用了,编辑的博文样式和发布出来的完全不一样!"  "编辑器不是有自动保存草稿的功能吗?为什么我的草稿箱没有了,做了无用功,好难过"  为此小编也是费尽周折,在编辑器实在是无法修改的情况下,为大家谋的一份福利,为大家找到一个很好的线上编辑器的网站,完全解决了博主们的烦恼~  这个编辑器不仅能实现博客编辑器正常的使用功能以外还实现了实时保存的功能,满足博主编辑的草稿用永远不会丢失的担忧.同时,还能保存样式的问题,简直是博

致全体51CTO博主:洛阳亲友如相问,就说你在手机里

各位51CTO的博主们,在近期我们优化了博客的H5移动站,可以支持在手机上便捷浏览博客主页.博文页面,还可以支持用户在文章下面评论互动.移动时代,我们的博客也加快了移动化的步伐,"洛阳亲友如相问",就说你在手机里. 具体说明如下: 一.你的博客主页在手机里 进入路径:手机浏览器输入自己的博客主页地址,自动进入手机适配模式,如下: 二.你的博文在手机里 进入路径:在文章页下方-分享-微信图标,点击弹出二维码,使用微信扫一扫,进入博文页手机版,样式如下:  三.你的评论互动在手机里 进入路