想要接触人工智能吗？先要学会如何阅读论文

凭借着对算法和AI的向往，终于有机会接触到人工智能的领域。现在的主要工作就是在OCR文字识别，期间也看了不少的论文，从CTPN到Faster RCNN，再到EAST和FOTS。最开始因为刚接触这个领域，很多名词看不懂，论文阅读非常吃力，后来随着知识的积累和深入，现在阅读也变得轻松起来。最近关注爱可可老师的微博，刚好发现了这篇文章——《How to Read a Paper》，感觉非常适合我这种英语不好、但是又需要阅读论文的人。

本文就结合最近几个月阅读论文采的坑与《How to Read a Paper》结合，摸索一下大佬们的阅读方法。

一般的机器学习工程师或者深度学习工程师，都要阅读大量的论文积累相关的领域知识。但是阅读论文本身却很少有人能传授一些经验，这篇文章提出了一种“三步法（three-pass method）”的方法，下面就来介绍一下。

背景

通常会有很多原因需要阅读论文，比如回顾某个会议或者课程、对某个领域持续的关注、开拓新的领域等等。一个专业的学术研究员或者AI研究员可能需要花费几百个小时来阅读论文，因此高效的阅读论文，是一种必不可少的经验和技能。对于刚开始阅读论文的人来说，需要经过不断的尝试和犯错，才能总结出经验和教训。作者凭借多年的阅读经验，总结出了阅读论文的“三步法”，下面就来看看到底是如何操作的吧。

三步法

阅读论文最笨拙的方法就是从头读到尾，有的时候浪费了大量的时间还不知道作者到底说了什么。如果采用三步法，一般是这么个流程：

第一步，对论文的主题，对论文的核心内容有一定的了解
第二步，了解论文的核心思想
第三步，深入理解论文、尝试复现

第一步

通过快速的浏览论文，对论文有一个整体的了解，然后决定是否有必要继续深入阅读。这个阶段大概花费5-10分钟，主要会做下面的事情：

1 仔细阅读标题、摘要和介绍
2 粗略的阅读小节部分
3 浏览一下数学公式，对基本的理论有一定的把握
4 阅读结论
5 浏览相关引用，剔除读过的文章

通过这个阶段，检查一下自己能否回答下面几个问题：

1 分类方面：这篇文章属于那种类型？这篇文章的结论是通过什么指标衡量的？是否有现成的系统参考？是否有基础的模型理论参考？
2 内容方面：其他的论文有没有跟这个类似的？这篇论文有没有什么参考的核心理论？
3 准确性方面：这篇论文的结论可信吗？
4 贡献度方面：这篇论文有什么新的想法？
5 清晰度方面：这篇论文写得好吗？容易理解吗？

通过上面的信息，你就可以决定是否要继续深入下去了。如果这篇文章你压根不感兴趣，或者你暂时还不能理解它，又或者认为作者的结论是错误的，那就没必要继续阅读了。也可以把它暂时放在一边，过一段时间再来考虑要不要继续阅读。

另外，如果你也许要写论文，那么通过这个部分你应该也能了解到哪一部分是最重要的。首先一定要保证标题和副标题的连贯性、摘要的清晰程度，不然阅读者很有可能阅读完摘要、扫过标题后，就放弃阅读了。

第二步

在第二步中，需要阅读的更仔细点，但是可以把论证的部分给去掉。在阅读的时候可以划重点、抓关键词进行标记，也可以把阅读时不理解的地方记下来。这样再次阅读的时候就可以多注意和思考这些问题，自己写论文的时候也会更注意到类似的点。

1 仔细的阅读论文中的图片、表格以及其他说明，尤其是要注意图片，标注的信息是否正确？有没有标错？可信么？如果发现错误，那么这篇文章很有可能不是什么好文章。
2 标记那些引用的还没阅读的论文，这样可以通过一篇论文在领域内引申开，扩大对领域知识的了解。

第二个阶段大概需要花费一个小时的时间来仔细阅读，通过这个步骤就可以抓住论文的核心内容了。你可以尝试总结一下论文的主要内容、支撑的论点等等。

有时经过这个阶段还是对论文不理解，这有可能是因为刚刚接触这个领域，对于很多的概念和新名词都不了解，或者作者使用的一些论点论据难以理解，也可能是作者对于一些关键点没有描述清楚。那么你可以选择：

1 把这篇论文先放在一边，希望你自己的工作或者科研不会用到相关的内容
2 先阅读一下相关的背景资料引用论文，再回来看看
3 尝试进行第三个步骤

第三步

为了更好的了解论文中的内容，最关键的就是第三步了，这一步需要读者尝试复现论文。假设你现在有了跟作者一样的思路，那么如何来复现它？通过复现的过程，就能轻松的理解文章的核心点，并且发现一些隐藏的坑和结论。

这一步就需要更加关注论文的细节了，需要理解和挑战论文中的每一个结论，甚至你可以自己想想有没有其他的思路。通过这种方式，就可以把一些虚拟的经验变成自己的真实经验了。对于现在这个开放的互联网时代，最简单的办法就是去github里面搜搜有没有现成的代码，直接阅读别人公开的源码。

这个步骤可能会花费几个小时、几天甚至几个月。经过这个阶段，你可以轻松的在脑海中重现整个论文的思路和结构，你也能抓住论文隐藏的结论，论文之外的工作，实验过程中潜在的问题以及分析的方法。

最后

阅读论文总的来说还是一个经验活，最起码需要有几十篇的阅读量，才能进入一个陌生的领域。通过这个“三步法”，你可以快速的判断这篇论文是否值得深入阅读，是否是你感兴趣的话题。

对于如何扩展知识、怎么筛选论文，可以通过下面的方法。

首先需要一个学术性的搜索引擎，比如Google学术、CiteSeer，输入3-5个关键词进行搜索。
然后通过快速通读论文，了解论文的相关工作。
接下来，可以通过搜索作者的明细，查找他的其他文章，加入阅读列表中。
查看关键作者最近的发表以及相关的顶级会议，一般能发表到顶级会议的论文都属于质量很高的论文。
最后关注顶级会议最近的录入论文，快速浏览相关的内容，能帮你了解相关领域的发展情况。

希望读者都能在自己感兴趣的领域快速积累起来，未来也会持续的关注爱可可老师的微博，真的很有用！

参考

How to Read a Paper
爱可可老师的微博

原文地址：https://www.cnblogs.com/xing901022/p/10161727.html

时间： 2024-10-11 01:44:52

想要接触人工智能吗？先要学会如何阅读论文

背景

三步法

第一步

第二步

第三步

最后

参考

想要接触人工智能吗？先要学会如何阅读论文的相关文章

【原创】连“霍金”都想学习的“人工智能”---【自己动手写神经网络】小白入门连载开始了（1）

连“霍金”都想学习的“人工智能”---【自己动手写神经网络】小白入门连载开始了（1）

陈记抄同学说 “想弄清楚量子力学，就只能学会波动方程”，这话我可不爱听了

想要转人工智能，程序员该如何学习？（转）

《Entity Framework 6 Recipes》中文翻译系列 (40) ------ 第七章使用对象服务之从跟踪器中获取实体与从命令行生成模型（想解决EF第一次查询慢的，请阅读）

想靠人工智能实现IPO，搜狗故事里缺的不只是创新

专访吴恩达：我不关心人工智能是否变邪恶

从零开始学习开发人工智能(一)

想做web前端工程师应该学习些什么？