How to Read a Technical Paper
如何阅读科技论文
Jason Eisner (2009) 写
多轮阅读
首先将论文浏览一遍,跳过所有需要费劲思考的地方。只需要知道论文的目标,作者为什么要写它,以及哪些地方对你来说是老生常谈而哪些是新鲜的。为了强迫自己不作停留地看下去,限制每页的阅读时间,或者使用PDF阅读器的自动滚屏功能。
至此,假如文章看起来还是值得花时间去读,那么,回到开头重新细读全文。
S. Keshav 给出了三轮阅读法的详细讨论:你在每一轮应该做什么?
边读边写
边读边写。这会让你精神集中并且让你与所读文章有所交互。
低级笔记
通常,在打印稿上涂画是最容易的,你可以在公式、插图和文字的附近作出你的回应。所以如果你阅读的是打印稿,那么,将你涂画过的稿子进行归档或者扫描出来,供日后参阅。
(或者可以直接在PDF文件上涂画,省得打印和扫描。Acrobat的一个免费的替代品是PDF-XChange
Viewer,这是一个Windows程序,通过wine,同样可以在Linux上运行。
在论文上做笔记,你可以
- 用你自己的语言重写文中描述得不清晰的观点
- 填补文中省略的细节(假设、代数步骤、证明、伪代码)
- 构思能够印证作者想法,或者会使作者陷入困境的例子
- 连系上你所知道的其他方法或其他问题
- 针对没有给予陈述或者不合理的地方提出你的疑问
- 挑战文章的主张或方法
- 发起畅想,看看有什么后续工作是你(或别人)应该去跟进的
高级笔记
低级笔记并不足够。还需要做高级笔记。对文章进行提炼非常有用:总结吸引你的东西,与其他论文作对比,记录你的疑问以及对自己未来研究工作的想法,等。作这样的提炼,可以让你抱着目标进行阅读,而且所做的笔记日后会对你有所帮助。
Michael Mitzenmacher
写道:“富创造性地阅读吧。批判性阅读是容易的,摧毁事物总比建造它更为容易。富创造性的阅读需要更强更主动的思考。论文中有什么好想法?这些想法是不是有
其他用途或扩展形式是作者没有想到的?这些想法可以进一步一般化吗?是否有可能对这些想法作出改善从而使其实际效果获得显著提高?如果你打算以这篇论文为
基础来开展你的研究,那么你的下一步应该做什么?
我建议将你的笔记根据你读论文的时间按时间进行排序,这样做,可以帮助你找回某些已经印象依稀的论文,或者让你回忆起在同一时期你所阅读过的其他论文。有些时候你又可能会希望根据作者、题目等信息进行搜索,所以,对每篇论文,在做笔记之前,首先写一个粗略的引言。(参阅
How
to Organize Your Files。)
如果你需要对某个观点下很大功夫以求获得真正理解,你可以通过在相关的维基页面发起讨论,与其他人分享你的努力(并将这些努力记录下来供自己日后参考)。
何时何地进行阅读
尽早开始。精神分散的时候,离开足够长的时间。你可以暂时把论文放下,等阅读心情好些后再继续。比强迫自己按时将论文读完,这样做会更好一些。
有些人会觉得在一天中某些特殊的时间进行阅读会更容易些,或是吃饭的时候,或是走路的时候,或是骑自行车的时候。你在吃早饭或者上厕所的时候,是不是会习惯性地拿起离你最近的东西来阅读?在那些地方给自己留些论文吧。
尝试找一个朋友与你一起阅读!两人并排坐在一起,阅读同一份稿子,双方的阅读速度以段落或句子为单位,保持同步。时不时地大声朗读。这样做,一方面可以互相推动,使得双方保持往下读,另一方面还可以帮助对方啃过难啃的地方。阅读的过程中,进行必要的讨论。
留出时间
当你接触一个新领域的时候,要彻底读懂一篇论文可能需要花费数个小时的时间。没有关系,为了真正读懂一篇好的或者奠基性的论文,花那么多时间是值得的。对于你以后的阅读或者研究来说,这样做可谓磨刀不误砍柴工。
我腾不出那么多时间!别
担心,不是所有的论文都需要这么多时间。论文与论文间有很多点子都是重复使用的,所以,你的阅读速度会越来越快。到目前为止,对我熟悉的领域,我通常可以
再30分钟甚至更短的时间内看完一篇论文,因为这些论文的动机部分都是类似的,而且大部分常规的论文布局我都可以识别出来。(毕竟,大部分论文都会落入现
有工作的范围内。它们在现有工作的基础上,延伸出一两个真正的新点子,以及一些可能并不那么要紧的支撑性细节。)
但我已经是一个三年级的学生,为什么这篇论文还费了我这么长时间?阅
读速度慢并不是什么羞愧的事情。对一篇讲述一些我真心不懂的东西的论文,我依然需要花费几个小时去吸收它。(在我自己的领域,我同样需要花费数个小时的时
间去审阅一篇论文,因为我肩负着指出论文中所有错误,或者找出所有需要进一步完善的地方的责任。75%提交上来的会议论文都会被拒绝,而剩下的25%论文
在真正发表之前依然需要完善。)
关注哪些部分
那么,在第二轮阅读中你是不是真的必须认真地把整篇论文都读完?有时候是的,但并不总是如此。这取决于你为什么要阅读这篇论文。
我确实认为,要学习一个新领域就必须非常透彻地阅读至少几篇论文。那意味着看懂每个句子和每个上标的作用,因为这样你才能真正学到论文中所用到的所有技术。并且理解为什么事情被做成这样:问自己一些笨问题并作出回答。训练译解全文的能力——就像你在细致审稿时尝试揪出每一处错误、草率的思考又或者不完整之处一样。这样做会让你的批判性思考更为敏锐犀利。你会希望在计划、执行或者描述自己的研究的时候用上你那经过训练的火眼金睛。
然而,偶尔有些论文依然是不值得马上读懂所有细节的。或许那些细节并不足够吸引你,又或者你觉得自己暂时还没法看懂。对一篇典型的论文,考虑以下部分:
- 动机。你会希望很好地理解这一部分,否则阅读这篇论文根本毫无意义。但动机部分的某些内容可能基于某些你不知道的东西(数学背景或者此前工作)。如果你不想马上去跟踪相关的文献,你可以在你的阅读清单中提高这些文献的优先级。
- 数学和算法。这些部分是论文的技术核心。因此对待这些部分,不要习惯于略读。(你可以在了解作者怎样解决他们的问题中学到很多东西。)尽管如此,你可以跳过一个技术章节如果
- 它看起来像是对一些你已经知道的东西的解释。在这种情况下,只需要检查一下它所讲的是不是那个你已经知道的东西。
- 虽然彻底理解这些方法很可能会马上有所收益,但这些东西并不适合在这篇文章里面学习,或者这些东西现在的你来说太过高级了。明确哪些内容是你可以胜任的,并且把它们放到你的学习清单里面切实地付诸学习。也可以请别人解释给你听,或者给你推荐一本读物。
- 看起来像是个丑陋的、专设的、无论如何都不会有人使用的方法。对这样的方法,完全理解它的唯一原因是你想批判它或者希望改进它。(同样地,尽管你要跳过这些丑陋的细节,但还是需要理解作者的直觉是什么。想想怎样用一种更为优雅的方式捕获这些直觉。)
- 就目前来说,只需要知道这种方法存在就可以了。它看起来像是现有方法的一个特殊化,所以你可能永远不会需要它。真的需要它的话,你自然会回来。
但你依然需要现在就搞清楚这种方法实现了什么功能(它的影响)。同时如果它可以应用起来,尝试对它采集数据,弄清楚它用起来有多大困难,是什么决定了它的运行时间和准确率。这样,你就会在需要它的时候记起它。
你需要跳过的部分是哪些难啃的部分:方法的内部运作(它的实现)以及关于方法正确性、有效性的所有证明。
- 实验。很多论文都会通过实验对方法进行验证。当你接触一个新领域,你应该细心调查实验通常是怎么做的(以及,你是否认可!)。留意所用的数据集以及代码同样有所帮助——以后或许用得上。
但一旦你知道了惯常的做法,就不会总是那么关注论文的实验部分。比较,有时候你阅读一篇论文只是为了寻找一些 新的问题或者技术来激发你的创造力。我坦承自己通常不怎么关注论文中的实验细节——尽管例子或错误分析,它们 真的会吸引我的注意力,因为它们经常有闪光点。
如果你真的关心论文的结论(“方法有效吗?”“我应该使用吗?”),那么你应该回过头去详细检查实验的设计,包括数 据的选取。实验公平吗?是不是支持论文所声称的结论?实验运作的过程中究竟发生了什么?文章的结论看上去像不 像是能通过实验方案推导出来的?
简而言之,做明智的时间投资。关注于那些值得你带走的东西。如果你无法识别论文中哪些部分是最有趣或者最重要的,问问那些知道的人!如果你不知道该问谁,找一篇引用过这篇论文的论文(通过Google Scholar),看看它们提到这篇论文的时候都说了什么。
Delip Rao
建议:“如果你想了解X,永远不要看最先提出X的原文。相反,先去看几篇出现在这篇论文之后的论文对X的讨论,获得对X的初步了解后再看原文。某程度上,学界对一个点子的解释比原文作者远远来得清晰。”
读什么
- 做一些富创意的网络搜索
- 多进行几次搜索进行试验
- 把自己当成作者;他们会用哪些词汇?
- 成为一个强大的搜索者!(读读搜索引擎的帮助页)
- 专门性强的搜索,在ACL Anthology、Google Scholar等网站进行
- 跟踪相关工作(一旦你理解了一篇相关论文后)
- 前续参考文献:沿着参考书目去找更早期的论文
- 后续参考文献:看谁引用了这篇论文(通过Google
Scholar等类似渠道)
- 是不是有人已经列出了你需要的论文?
- 发表在学术期刊上的综述论文(“survey papers”,也称“review articles”)
- 课程大纲
- 阅读小组的页面
- 教科书上的章节名
- 在线教学
- 学位论文的文献综述章
- 来自朋友或教授(包括其他学校的教授)的直接推荐
- 广度优先搜索
- 在决定哪些论文最值得阅读之前,阅读大量的论文摘要(根据需要跳过一些论文)
- 同时阅读多篇相关的论文没有问题,来回切换地读,弄清它们之间的关系
- 建立对领域全景的感觉,将近期相关的研讨会、学术会议或期刊的专设主题会议的会议记录过一遍
- 当前进变得艰难,切换到背景知识的阅读
- 教科书或教程
- 综述文章
- 学位论文中的引言章或文献综述章
- 被多次引用的更早期的论文
- 偶尔可以尝试一下维基百科
原文页面:http://cs.jhu.edu/~jason/advice/how-to-read-a-paper.html