How to Read a Technical Paper(翻译:Trey;审校:Shooya)

How to Read a Technical Paper


如何阅读科技论文


Jason Eisner (2009) 写


多轮阅读


首先将论文浏览一遍,跳过所有需要费劲思考的地方。只需要知道论文的目标,作者为什么要写它,以及哪些地方对你来说是老生常谈而哪些是新鲜的。为了强迫自己不作停留地看下去,限制每页的阅读时间,或者使用PDF阅读器的自动滚屏功能。

至此,假如文章看起来还是值得花时间去读,那么,回到开头重新细读全文。

S. Keshav 给出了三轮阅读法的详细讨论:你在每一轮应该做什么?


边读边写

边读边写。这会让你精神集中并且让你与所读文章有所交互。

低级笔记

通常,在打印稿上涂画是最容易的,你可以在公式、插图和文字的附近作出你的回应。所以如果你阅读的是打印稿,那么,将你涂画过的稿子进行归档或者扫描出来,供日后参阅。

(或者可以直接在PDF文件上涂画,省得打印和扫描。Acrobat的一个免费的替代品是PDF-XChange
Viewer
,这是一个Windows程序,通过wine,同样可以在Linux上运行。

在论文上做笔记,你可以

  • 用你自己的语言重写文中描述得不清晰的观点

  • 填补文中省略的细节(假设、代数步骤、证明、伪代码)

  • 构思能够印证作者想法,或者会使作者陷入困境的例子

  • 连系上你所知道的其他方法或其他问题

  • 针对没有给予陈述或者不合理的地方提出你的疑问

  • 挑战文章的主张或方法

  • 发起畅想,看看有什么后续工作是你(或别人)应该去跟进的

高级笔记

低级笔记并不足够。还需要做高级笔记。对文章进行提炼非常有用:总结吸引你的东西,与其他论文作对比,记录你的疑问以及对自己未来研究工作的想法,等。作这样的提炼,可以让你抱着目标进行阅读,而且所做的笔记日后会对你有所帮助。

Michael Mitzenmacher
写道:“富创造性地阅读吧。批判性阅读是容易的,摧毁事物总比建造它更为容易。富创造性的阅读需要更强更主动的思考。论文中有什么好想法?这些想法是不是有
其他用途或扩展形式是作者没有想到的?这些想法可以进一步一般化吗?是否有可能对这些想法作出改善从而使其实际效果获得显著提高?如果你打算以这篇论文为
基础来开展你的研究,那么你的下一步应该做什么?

我建议将你的笔记根据你读论文的时间按时间进行排序,这样做,可以帮助你找回某些已经印象依稀的论文,或者让你回忆起在同一时期你所阅读过的其他论文。有些时候你又可能会希望根据作者、题目等信息进行搜索,所以,对每篇论文,在做笔记之前,首先写一个粗略的引言。(参阅
How
to Organize Your Files
。)

如果你需要对某个观点下很大功夫以求获得真正理解,你可以通过在相关的维基页面发起讨论,与其他人分享你的努力(并将这些努力记录下来供自己日后参考)。

何时何地进行阅读

尽早开始。精神分散的时候,离开足够长的时间。你可以暂时把论文放下,等阅读心情好些后再继续。比强迫自己按时将论文读完,这样做会更好一些。

有些人会觉得在一天中某些特殊的时间进行阅读会更容易些,或是吃饭的时候,或是走路的时候,或是骑自行车的时候。你在吃早饭或者上厕所的时候,是不是会习惯性地拿起离你最近的东西来阅读?在那些地方给自己留些论文吧。

尝试找一个朋友与你一起阅读!两人并排坐在一起,阅读同一份稿子,双方的阅读速度以段落或句子为单位,保持同步。时不时地大声朗读。这样做,一方面可以互相推动,使得双方保持往下读,另一方面还可以帮助对方啃过难啃的地方。阅读的过程中,进行必要的讨论。

留出时间

当你接触一个新领域的时候,要彻底读懂一篇论文可能需要花费数个小时的时间。没有关系,为了真正读懂一篇好的或者奠基性的论文,花那么多时间是值得的。对于你以后的阅读或者研究来说,这样做可谓磨刀不误砍柴工。

我腾不出那么多时间!
担心,不是所有的论文都需要这么多时间。论文与论文间有很多点子都是重复使用的,所以,你的阅读速度会越来越快。到目前为止,对我熟悉的领域,我通常可以
再30分钟甚至更短的时间内看完一篇论文,因为这些论文的动机部分都是类似的,而且大部分常规的论文布局我都可以识别出来。(毕竟,大部分论文都会落入现
有工作的范围内。它们在现有工作的基础上,延伸出一两个真正的新点子,以及一些可能并不那么要紧的支撑性细节。)

但我已经是一个三年级的学生,为什么这篇论文还费了我这么长时间?
读速度慢并不是什么羞愧的事情。对一篇讲述一些我真心不懂的东西的论文,我依然需要花费几个小时去吸收它。(在我自己的领域,我同样需要花费数个小时的时
间去审阅一篇论文,因为我肩负着指出论文中所有错误,或者找出所有需要进一步完善的地方的责任。75%提交上来的会议论文都会被拒绝,而剩下的25%论文
在真正发表之前依然需要完善。)

关注哪些部分

那么,在第二轮阅读中你是不是真的必须认真地把整篇论文都读完?有时候是的,但并不总是如此。这取决于你为什么要阅读这篇论文。

我确实认为,要学习一个新领域就必须非常透彻地阅读至少几篇论文。那意味着看懂每个句子和每个上标的作用,因为这样你才能真正学到论文中所用到的所有技术。并且理解为什么事情被做成这样:问自己一些笨问题并作出回答。训练译解全文的能力——就像你在细致审稿时尝试揪出每一处错误、草率的思考又或者不完整之处一样。这样做会让你的批判性思考更为敏锐犀利。你会希望在计划、执行或者描述自己的研究的时候用上你那经过训练的火眼金睛。

然而,偶尔有些论文依然是不值得马上读懂所有细节的。或许那些细节并不足够吸引你,又或者你觉得自己暂时还没法看懂。对一篇典型的论文,考虑以下部分:

  • 动机。你会希望很好地理解这一部分,否则阅读这篇论文根本毫无意义。但动机部分的某些内容可能基于某些你不知道的东西(数学背景或者此前工作)。如果你不想马上去跟踪相关的文献,你可以在你的阅读清单中提高这些文献的优先级。

  • 数学和算法。这些部分是论文的技术核心。因此对待这些部分,不要习惯于略读。(你可以在了解作者怎样解决他们的问题中学到很多东西。)尽管如此,你可以跳过一个技术章节如果

    • 它看起来像是对一些你已经知道的东西的解释。在这种情况下,只需要检查一下它所讲的是不是那个你已经知道的东西。

    • 虽然彻底理解这些方法很可能会马上有所收益,但这些东西并不适合在这篇文章里面学习,或者这些东西现在的你来说太过高级了。明确哪些内容是你可以胜任的,并且把它们放到你的学习清单里面切实地付诸学习。也可以请别人解释给你听,或者给你推荐一本读物。

    • 看起来像是个丑陋的、专设的、无论如何都不会有人使用的方法。对这样的方法,完全理解它的唯一原因是你想批判它或者希望改进它。(同样地,尽管你要跳过这些丑陋的细节,但还是需要理解作者的直觉是什么。想想怎样用一种更为优雅的方式捕获这些直觉。)

    • 就目前来说,只需要知道这种方法存在就可以了。它看起来像是现有方法的一个特殊化,所以你可能永远不会需要它。真的需要它的话,你自然会回来。

      但你依然需要现在就搞清楚这种方法实现了什么功能(它的影响)。同时如果它可以应用起来,尝试对它采集数据,弄清楚它用起来有多大困难,是什么决定了它的运行时间和准确率。这样,你就会在需要它的时候记起它。

      你需要跳过的部分是哪些难啃的部分:方法的内部运作(它的实现)以及关于方法正确性、有效性的所有证明。


  • 实验。很多论文都会通过实验对方法进行验证。当你接触一个新领域,你应该细心调查实验通常是怎么做的(以及,你是否认可!)。留意所用的数据集以及代码同样有所帮助——以后或许用得上。

   但一旦你知道了惯常的做法,就不会总是那么关注论文的实验部分。比较,有时候你阅读一篇论文只是为了寻找一些   新的问题或者技术来激发你的创造力。我坦承自己通常不怎么关注论文中的实验细节——尽管例子或错误分析,它们   真的会吸引我的注意力,因为它们经常有闪光点。

   如果你真的关心论文的结论(“方法有效吗?”“我应该使用吗?”),那么你应该回过头去详细检查实验的设计,包括数   据的选取。实验公平吗?是不是支持论文所声称的结论?实验运作的过程中究竟发生了什么?文章的结论看上去像不   像是能通过实验方案推导出来的?

简而言之,做明智的时间投资。关注于那些值得你带走的东西。如果你无法识别论文中哪些部分是最有趣或者最重要的,问问那些知道的人!如果你不知道该问谁,找一篇引用过这篇论文的论文(通过Google Scholar),看看它们提到这篇论文的时候都说了什么。

Delip Rao
建议:“如果你想了解X,永远不要看最先提出X的原文。相反,先去看几篇出现在这篇论文之后的论文对X的讨论,获得对X的初步了解后再看原文。某程度上,学界对一个点子的解释比原文作者远远来得清晰。”


读什么


  • 做一些富创意的网络搜索

    • 多进行几次搜索进行试验

    • 把自己当成作者;他们会用哪些词汇?

    • 成为一个强大的搜索者!(读读搜索引擎的帮助页)

    • 专门性强的搜索,在ACL AnthologyGoogle Scholar等网站进行

  • 跟踪相关工作(一旦你理解了一篇相关论文后)

    • 前续参考文献:沿着参考书目去找更早期的论文

    • 后续参考文献:看谁引用了这篇论文(通过Google
      Scholar
      等类似渠道)

  • 是不是有人已经列出了你需要的论文?

    • 发表在学术期刊上的综述论文(“survey papers”,也称“review articles”)

    • 课程大纲

    • 阅读小组的页面

    • 教科书上的章节名

    • 在线教学

    • 学位论文的文献综述章

    • 来自朋友或教授(包括其他学校的教授)的直接推荐

  • 广度优先搜索

    • 在决定哪些论文最值得阅读之前,阅读大量的论文摘要(根据需要跳过一些论文)

    • 同时阅读多篇相关的论文没有问题,来回切换地读,弄清它们之间的关系

    • 建立对领域全景的感觉,将近期相关的研讨会、学术会议或期刊的专设主题会议的会议记录过一遍

  • 当前进变得艰难,切换到背景知识的阅读

    • 教科书或教程

    • 综述文章

    • 学位论文中的引言章或文献综述章

    • 被多次引用的更早期的论文

    • 偶尔可以尝试一下维基百科

原文页面:http://cs.jhu.edu/~jason/advice/how-to-read-a-paper.html

时间: 2024-11-05 08:09:34

How to Read a Technical Paper(翻译:Trey;审校:Shooya)的相关文章

项目集管理研究中心专家翻译与审校《项目集管理标准》

(2014年7月4日 北京) 共创国际-项目管理者联盟下属项目集管理研究中心(Program Management Research center)专家杨侃教授与林勇副主任参与翻译并审校<项目集管理标准>(<The Standard for Progra management>). <项目集管理标准>的引进与推广必将提升中国大型项目与项目群管理的实践水平.欢迎对该标准有研究与学习兴趣的企业经理,业界专家参与标准的交流.学习与研讨,共同推广项目集管理在中国的应用与发展.

如何写科技论文How to write a technical paper

This is the evolving set of recommendations I share with my graduate students for technical writing... Empathy: This is the single most important principle of technical writing.  Try reading what you write from the perspective of somebody who has not

[Paper翻译]Scalable Lock-Free Dynamic Memory Allocation

原文: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.87.3870&rep=rep1&type=pdf Abstract 动态内存分配器(malloc/free)在多线程环境下依靠互斥锁来保护共享数据的一致性.使用锁在性能,可用性,健壮性,程序灵活性方面有很多缺点.Lock-free的内存分配器能消除线程延迟或被杀死以及CPU的调度策略对程序的性能影响.这篇paper呈上了一个完整的无锁内存分配器.它的实现只使用被广泛支

How to implement an algorithm from a scientific paper

Author: Emmanuel Goossaert 翻译 This article is a short guide to implementing an algorithm from a scientific paper. I have implemented many complex algorithms from books and scientific publications, and this article sums up what I have learned while se

Life with Adeos-xenomai(翻译官方文档)

//Life with Adeos PhilippeGerum RevisionB Copyright? 2005 Copyright ? 2005Philippe Gerum Permission is granted to copy, distribute and/or modify thisdocument under the terms of the GNU Free Documentation License, Version 1.2 orany later version publi

国内可外用免费语料库下载资源汇总, 语言翻译必备:国内外23个语料库推荐

国内可外用免费语料库下载资源汇总 (一) 国家语委1.国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了.重开后的在线检索速度更快,功能更强,同时提供检索结果下载.现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料. 2.古代汉语语料库http://www.cncorpus.org/login.aspx网站现在还增加了一亿字的古代汉语生语料,研究古代汉语的也可以去查询和下载.同时,还提供了分词.词性标注软件.词

Code is not literature

http://www.gigamonkeys.com/code-reading/ I have started code reading groups at the last two companies I’ve worked at, Etsy and Twitter, and some folks have asked for my advice about code reading and running code reading groups. Tl;dr: don’t start a c

Doherty Threshold

Prior to the publication of the IBM technical paper behind what commonly known today as the Doherty Threshold[1] "... it was thought that a relatively slow response, up to two seconds, was acceptable because the person was thinking about the next tas

thread_Disruptor

转自 知乎 https://zhuanlan.zhihu.com/p/21355046 order从client端传入,decode后进行matching,一旦存在可成交的价格,就要publish到time series,并且把trade存到local的database里.如何handle这么大数量的数据? 这并不是一个新生的问题.一个经常想到的模型是producer consumer model. 当系统的处理速度比不上导入数据的速度时,可以增加一个queue(buffer)暂存数据,等待co