《How to Fine-Tune BERT for Text Classification》-阅读心得

文章名《How to Fine-Tune BERT for Text Classification》,2019,复旦大学

如何在文本分类中微调BERT模型?

摘要:预训练语言模型已经被证明在学习通用语言表示方面有显著效果,作为一种最先进的预训练语言模型,BERT在多项理解任务中取得了惊人的成果。在本文中,作者针对文本分类任务的BERT微调方法,给出了微调模式的一般解决方案。最后,提出的解决方案在8个广泛研究的文本分类数据集上获取了最新的结果。

作者认为尽管BERT在多项自热语言理解任务中获得了令人惊人的结果,但其潜在的能力依然没有被探索出来,几乎很少有研究工作在增强BERT性能方面,所以研究如何最大化限度的利用BERT在文本分类中的任务,探索了几种微调的方法,并进行了详细的分析。

进行了如下散步操作:1)进一步在开放域预训练BERT;2)采用多任务方式可选择性地微调BERT;3)在目标任务上微调BERT。同时研究了fine-tuning技术对Bert在长文本任务、隐藏层选择、隐藏层学习率、知识遗忘、少样本学习问题上的影响。

1. 微调策略:不同网络层包含不同的特征信息,哪一层更有助于目标任务?这是一个考虑的方向

2. 进一步预训练:在目标域进一步得到预训练模型

3. 多任务微调:多任务可以挖掘共享信息,同时对所有任务进行微调是否,使用多任务策略对结果有帮助。

使用框架:

该文的重点放在了是否进行Further Pre-training和Multi-Task Fine-Truning,在实际文本分类过程中,模型微调的策略可以从以下几个方法开展:

1. 处理文本的长度。1)Truncation methods,head+tail方法被证明是有效的,具有最佳的性能;2)Hierarchical methods,先将长文本切割成 K = L / 510 个片段,之后分别取不同片段的向量表示。

2. 不同网络层的特征学则。IMDb 数据集中进行,最后显示只使用最后一层的输出取得了最佳性能。

3. 灾难性遗忘。使用BERT时尽量使用小的学习率,模型能够有效、快速收敛,2e-5

4. 不同层次的学习率衰减。模型底层用于捕捉详细、通用的特征信息,需要更低的学习率来寻求最优解;顶层更直接与任务相关,需要更大的学习率加速学习,这一点时借鉴ULMFit中的三角学习率。

5. 进一步预训练。BERT是在通用域训练得到的,但实际的任务局限在一个单一的领域,为了更好地适应下游任务,作者在BERT又在训练集、领域文本和交叉域文本进行一定步数的Pretraining,实验结果也显示出一定优势。在训练集做Pretraining时,作者指出,训练的步数太少达不到效果,太多会造成灾难性遗忘,选择100K作为一个训练步数是合理的。

6. 在领域内的Pretraing具有较好的效果

7. 多任务实验效果,在交叉领域中得到的模型也有最佳的性能

有价值结论:

1)BERT的顶层输出对文本分类更加有用;

2)适当的分层递减学习策略能够有助于BERT克服灾难性遗忘;

3)任务内的进一步预训练模式可以显著提高对任务处理的性能;

4)先进行多任务微调对单个任务微调有帮助,但没有进一步在训练集中预训练的方式提升大

5)BERT可以利用小数据改进任务

原文地址:https://www.cnblogs.com/demo-deng/p/12283165.html

时间: 2024-10-11 21:59:23

《How to Fine-Tune BERT for Text Classification》-阅读心得的相关文章

IT小小鸟阅读笔记

人生就像是一艘漂泊的船,你努力滑行了就会找到成功的彼岸,否则就漂泊一生.在这个物欲横流的时代有太多的诱惑使我们静不下心来,但是我们应该时时刻刻警醒自己要做一些对自己成长有意义的事,程序员虽然幸苦但是作为谋生手段来说是比较好的,毕竟工资不是开玩笑的,做到好还可以别旅游别工作,不用固定在一个场所工作.梦开始的方向就是大学毕业的时候,这句话是对好好学习的人来说,对于不学无术的来说是迷茫开始的时候,当然我觉得计算机学的好很重要,情商的培养也非常重要,不然大家都一致认为程序员是呆板的无趣的人,在网络公司的

《我是一只IT小小鸟》心得

虽然读这本书是老师布置的作业,但是读了几页后就被书中的内容所吸引住了.或许是因为我也是学这个专业的,所以书中的一些内容让我觉得非常的有兴趣.作为一个学习软件工程的大一学生还没真正的认识到这个专业的深奥,正是通过这本书的阅读让我这个一无所知的年轻人懂得这个行业.这本书不仅仅让我懂得了这些,而且让我学习这个专业更加的感兴趣,更是get到了学习和生活上的一些“新技能”. 想要学好这个专业不仅仅平时要认真学习,生活中还要随时抽空打打代码打好基础. 真正基础雄厚的人应该是可以将常用的基础性知识熟记成诵的人

《IT小小鸟》的阅读心得

新年过后我们迎来大一下学期,想想刚迈入大学的我们,充满着好奇与兴奋,仿佛就在昨天.时光飞逝而今,虽经过一学期的学习,仍对计算机专业充满困惑,对未来充满迷茫. 在我感到迷茫的时候,老师给我们介绍了这样的一本书<我是一只IT小小鸟>,起初在课堂上,我以为这本书应该也只是描写一些于IT相关的知识而已,于是乎只是仅仅像对待完成作业那样抽空百度了关于这本书的信息.然而却有些欣喜地发现<我是一只IT小小鸟>竟然是一本关于IT生涯的励志书籍.这本书是由很多不同作者不同篇幅组成的,他们基本都有不同

阅读《我是一只IT小小鸟有感》

 大学是一段人生的特殊旅程,时间总是在我们的不经意间悄悄的流逝,一转眼 所为的四年大学已经过了8分之1, 这还有多少个8分之1可以用来浪费. 而在这8分之1的大学生活里,我已经学到了什么? 又收获了什么,又浪费了多少的青春.我总是这样问着自己,可是每天都是不一样的答案.我喜欢代码,喜欢手敲击在键盘上的感觉,喜欢钻研同学问我的代码问题,哪怕我想到头不断的作痛也无所谓,我的朋友说我偏执,我无所谓,我觉得认真对待我喜欢的,再偏执又如何. 这些天在看这本<我是一只IT小小鸟>,书中学长学姐的经历,才让

《我是一只IT小小鸟》阅读笔记

刚高考进入大学时, 总以为大学会像初中和高中一样,上了大学后才知道根本不一样.刚来大学时我很迷茫,因为上大学后的不适应以及对行业的不了解.直到有一天我们职业规划课老师推荐我们去看一本名叫<IT小小鸟>的书.其实一开始,我对这本书是一点兴趣都没有的,无非就是一些故事加上一些鼓励我们学习的话语而已,可是当我看过这本书时,我才意识带这并不是我想的那种无聊的书,而是真真正正可以使我受益匪浅的书. 正如书上所说.第一,我们要养成兴趣,你会发现几乎所有IT业的作者都对计算机技术或者IT行业有兴趣.学生都有

小小鸟 读后感

我是IT小小鸟 读后有感 阅读此书后的感觉和心得体会如下. 对于专业兴趣是第一原则 要尝试发现你的兴趣所在.特长所在,然后围绕这些来确定发展方向,不盲目从众和跟风. . 他山之石,可以攻玉,但不可照搬(借用书中). 因为环境不同,时代不同.更重要的是每个人都是独一无二的. 其他书中的作者大多出身"名门",有北大.清华.南大.华工等国内知名院校 而我的本科却是在一所普通大学,这是有差异的,想要不输于他人唯有默默积聚实力,最终突破环境的限制,登上一个新台阶 但是基础薄弱却又被外界所影响 颓

来吧,IT小小鸟(持续更新ing)

我是一只小小小小鸟,想要飞呀飞呀却飞不高啊....... 有人冷冷应对:你飞不高是因为学的不够 [中国目前还是启蒙时代,路子一不留神就错了.我更建议通过大量阅读,从科学中获得方法:技术与创业获得财富:大时间周期进行自我监控.自我反思与自我练习,获得竞争优势:参与志同道合的社区,与自我驱动的人共事,获得友情的路子. 未来时代,商业合作与个人发展,日益"阳谋".可以持续性地利用信息不对称牟利的机会越来越少:反之,可以持续性地利用智力不对称谋利的机会越来越多.当然,我所定义的智力,是神经智力

我是一只IT小小鸟读书笔记

春回大地.万物复苏,春天如期而至,而我内心的迷茫也从未消散.我害怕开学,开学意味着将漫无目的地学习自己本用不着的东西.但也在感慨时光似箭一去不返. 在大一这个懵懂的阶段中,许多大学生都不是很清楚自己将要面对的是什么,今后的方向,甚至现在该干些什么.一届又一届的学长学姐都告诫我们大一的新生不要虚度这四年的时光,青春太宝贵,千万别浪费.可我们又该做些什么呢?我们迷茫在学海中了.就当这时我们的职业生涯规划老师给迷茫中的我们推荐了一本名叫<我是一只IT小小鸟>的成长书籍.一开始我并不是太愿意去阅读这本

《我是一只IT小小鸟读后感》

在上大学之前,我对软件工程是一个什么专业根本了解不多,甚至有时感到很迷茫.在上完半学期之后还是对软件工程朦朦的,直至我读了<我是一只IT小小鸟>这本书,让我更深一步了解了IT行业. 让我体会很深的是以下几点: 一要有计划,并经常实践,二要多阅读有关专业的书籍,并常与他人交流经验,此外还有多做总结.三在面对困难时要独立解决,且冷静的.理智的分析原因.并能保持良好的心态去迎接新的挑战,这样才能走的更远.四要真正的并熟练的掌握基础知识.这样我们才有足够的墨水.五要时时关注新IT技术的更替,让我保持强

给个理由走下去——读《我是一只IT小小鸟》有感

和很多人一样,高考失利,迷迷茫茫的走进了软件学院.关于这个专业,具体学什么是一概不知,只知道学软件的很帅很帅,幻想着以后当个行侠仗义的黑客,或是开发一款自己的游戏都是十分诱惑人的.然而这个世界有个不成文的原则,理想很美满,现实很骨感,更可怕的是他们之间还成着正比例的关系. 我印象很深的就是第一节C课,学的是编译出一句“hello world”.没错,就是这个简单到不行的程序,可老师的节奏放的很慢很慢,让我们内心烦躁起来,我们要学更高端的东西,像这么简单看看书就会了.但是我很清楚的记得第二个程序我