如何阅读研究性论文?

原文:Advice on building a machine learning career and reading research papers by Prof.Andrew Ng

如何通过阅读研究型论文来有效的和相对快速地学习? 如果你想通过阅读学术性文献进行学习,无论你是想搭建一个感兴趣的机器学习项目/系统,或者仅仅是想获取更多最新的有关深度学习前沿知识,你应该怎么做?

下面我们会给出了一些基本的方法:

  1. 创建一份论文清单:试着列出一份你所关注领域的的研究性论文,或 Medium 文章,以及任何你拥有的文本或学习资源清单;
  2. 略过该论文清单。你应该以一种并行的方式阅读研究论文,意思是一次处理多篇论文。具体来说,试着快速浏览并理解每一篇文章,而不是全部读完,对于每一篇文章,也许你只读了其中的的10%到20%,这可能足以让你对手头的文章有一个高层次的理解。 之后,你可能会决定删除其中的一些论文,或者只是浏览一两篇论文,把它们通读一遍。

关于到底需读多少论文,Andrew Ng 给出了指导:

  • 如果你仅仅是想实现一个语音识别系统,那么阅读有关语音识别方面的 5-20 篇文献就足够了,但是如果你是想研究该领域的前沿问题,那么5-20篇论文可能还不足够。
  • 如果你想对某领域,比如语音识别的应用,有一个好的理解,那么你可能需要读 50-100 篇该领域的文章。

那如何阅读一篇论文呢?

对于一篇论文,不要从头读到尾,相反,要多读几篇,下面是具体的方法:

  1. 第一遍:阅读标题、摘要和图表。通过阅读标题、摘要、关键的网络架构图,可能还有实验部分,你将会对论文的概念有一个大致的了解。 在深度学习领域,有很多研究性论文都是将整篇论文总结成一两个图表,对此,我们不需要费力地通读全文。
  2. 第二遍:阅读引言、结论、图表,跳过其余的内容。 引言、结论和摘要是作者试图仔细总结他们的工作的地方,以便向审稿人阐明为什么他们的论文应该被接受和出版。 此外,浏览与本文工作相关的章节(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。 因此,它可能是有用的,但如果你不熟悉该领域,有时很难理解。
  3. 阅读论文,但是跳过数学公式。
  4. 通读全文,略过没有意义的部分。伟大的研究通常意味着我们是在知识和理解的边界上发表东西。当我们阅读论文(甚至是那些最有影响力的论文),你可能会发现,论文的某些部分可能用的很少或者根本某有意义。 因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。

当你阅读一篇论文时,试着回答以下几个问题:

  1. 作者试图解决的是什么?
  2. 该方法的关键要素有哪些?
  3. 对你有什么用(或者说有哪些可以借鉴的)?
  4. 有哪些其它的参考文献可以参考的。

如果你能回答上述几个问题,通常可以反映出你对该论文有了比较好的理解。 事实证明,当你读的论文越多,通过练习你获取到上述信息的速度也就越快。因为,很多作者在写论文时使用的是通用格式。

理解一篇论文需要花费多少时间?

对于刚接触机器学习的人来说,理解一篇相对简单的论文可能需要一个小时,这并不罕见。但是,有时你可能会偶然发现需要3个小时甚至更长时间才能真正理解的论文。

如何获取到这些论文?

网络上有很多好的资源。比如,对于新手来说,那些列出了语音识别领域最重要的论文清单的博客可能非常有价值。

随着深度学习的快速发展,很多人都试图跟上它的最新水平,了解最新进展。因此,这些是你应该经常光顾的地方。

  • Twitter。 令人惊讶的是,Twitter正成为研究人员发现新事物的重要场所。
  • Reddit 中的 ML 子板块
  • 重要的机器学习会议:NIPS、ICML、ICLR
  • 朋友:找一个对该领域感兴趣的社区或一群朋友,分享有趣的研究论文

如何更深入的理解论文中的数学公式?

试着从头开始重新推导。虽然,这需要一些时间,但这是一个很好的练习。

尝试编码实现

  1. 下载源码(如果能够找到),并运行。
  2. 从零开始重新实现:如果你能做到这一点,这是一个强有力的信号,说明你已经真正理解了手头的算法。

不断进步

继续学习和变得更好的最重要的事情是更稳定地学习,而不是进行集中密集的活动。 与其在短时间内死记硬背,不如下一年每周读两篇论文。

原文地址:https://www.cnblogs.com/offduty/p/11811947.html

时间: 2024-10-11 08:58:58

如何阅读研究性论文?的相关文章

如何阅读学术论文、聆听学术报告 —— 叶志明

如何阅读学术论文.聆听学术报告 叶志明 作为研究生导师,常常遇到研究生们提出有关阅读学术论文.聆听学术报告有困难的问题.这里将我自己的这方面心得与大家交流,希望对广大研究生有所帮助和启迪.因为我从事的是理工科专业,不知这些方法是否适合人文类学科?也许思想方法是一样的,仅供大家参考. 研究生阶段的一个很重要的学习手段是参加各类学术会议,聆听各类学术报告,以及大量地阅读文献.对于这类学术活动,研究生们开始往往会感到束手无策,因为既听不懂也看不懂,不知道怎么办好.其实这是非常正常的事情.一场学术报告或

我是如何阅读技术论文的

我是如何阅读技术论文的 须要通过paper获取知识.找到新的解决思路是非经常见的办法.可是在工作中因为压力经常会随便找一些paper读一些.做少量的思考就開始做了,这样往往不能对研究的对象不能有一个总体的看法.做了也不过做了.描绘研究对象概念的内涵和外延,描绘一个知识树,然后再去研究我们须要的那个点.以下给出了我自己的一点小经验. 一.     找寻综述论文 遇到一个新的课题时,经常会有无处下抓的感觉. 这是由于没有明白研究的目的,没有找到研究的对象.这时候就须要找一篇该领域的综述性文章,了解要

如何选择和阅读科技论文

转自 https://www.howsci.com/how-to-read.html# 作为一名研究生或者研究人员,每年可能要花费数百小时的时间阅读科技论文.通过阅读科技论文,可以对所研究领域有个大体认识,并且能了解所研究内容的最新进展,掌握最新的研究方法和内容. 但是部分人来说阅读科技论文并不得法,不仅浪费了大量的精力和时间,而且最后收获却很少.如何高效阅读科技论文,并且如何选择文献及如何阅读文献?本文作一介绍. 如何选择科技论文 现在信息发达,文献也是海量,刚开始如何选择文献阅读也是一门技巧

阅读学术论文的心得体会from小木虫

我们搞科研的很重要的一个环节就是文献的阅读!关于如何阅读文献?读什么,怎么读?结合我自己的体会,我想这里的关键在于要让我们通过这种方式的学习,学会看懂作者的思想.思路和科学方法,从中学习论文作者发现问题.提出问题.解决问题的过程.一篇学术论文,大致可以分成如下八个部分:论文题目,作者姓名与单位,论文中英文摘要,论文引言或引论,正文:可以是一节或几节,结论与致谢,参考文献,附录. :)一篇学术论文在手,怎么去阅读呢?一般可以有下面几个步骤:(1)看论文题目 看论文是否属于你要研究的领域.方向,该论

整理阅读的论文(七)

“科研做得好的同事,大家其实都在坚持看文章.” “那我也坚持.” ----和辰妈的对话   全四边形网格生成算法分为两大类,一类是直接法,主要是使用Paving方法(缺点是non robust)和四叉树法(缺点是在边界处网格的质量很差),另一类是间接法(先生成三角形网格,然后通过合成三角形网格形成四边形网格),介绍了两种方法,一种是合成法,一种是分解法,前者只能生成以四边形为主的网格(例子中800多个四边形网格,200个左右的三角形网格),并不能保证生成全四边形网格,后者要求先对网格的尺寸进行扩

整理阅读的论文(五)

他山之石,可以攻玉. ----<诗经·小雅·鹤鸣>        这篇文章的摘要读起来很舒服,依次介绍了采用的全局优化算法,优化函数的两个组成部分及其意义,算法的较低的时间复杂度(优点)和求解的技术手段(稀疏线性方程组)以及三个具体的应用场合,最后是实验结果.       Laplacian优化算法是最常用的一种网格优化方法,计算简单,几何意义直观[注1].但是它由三个主要的缺点,一是容易造成 "shrinkage" 的现象,即优化后的网格较优化前缩小了很多[注2]:二是优

整理阅读的论文(一)

这篇文章的基本思想(文中称为Local tangential lifting method,简称LTL)为将三维曲面上的三角形网格光顺(mesh smooth)问题通过投影转化到法平面上的二维网格上讨论(详见 3.1).其中,法平面的确定采用点邻接三角形的法线加权平均法(权因子选择的是点离三角形重心距离平方的倒数来确定,详见Equ(13)).      在 3.2 节中,通过 Taylor 展式来动态地确定离散 Laplace 算子的系数(普通的 Laplace 算子要么采用 uniform w

整理阅读的论文(三)

数学之所以有高声誉,其中一个理由就是数学使得自然科学实现定理化,给予自然科学某种程度的可靠性.                                                                                                                                                                        --阿尔伯特·爱因斯坦 网格优化已经被讨论了很多,这篇文章的主要亮点在

整理阅读的论文(二)

事实上,优化问题的分水岭不是线性和非线性,而是凸性和非凸性.[1]                                                                                                                                    ----(美)R.T.Rockafeller       记得以前看过 Laplacian 优化算法介绍时,它的物理背景是一个弹簧的弹性能最小的模型(注1),好像里面还有