想要接触人工智能吗?先要学会如何阅读论文

凭借着对算法和AI的向往,终于有机会接触到人工智能的领域。现在的主要工作就是在OCR文字识别,期间也看了不少的论文,从CTPN到Faster RCNN,再到EAST和FOTS。最开始因为刚接触这个领域,很多名词看不懂,论文阅读非常吃力,后来随着知识的积累和深入,现在阅读也变得轻松起来。最近关注爱可可老师的微博,刚好发现了这篇文章——《How to Read a Paper》,感觉非常适合我这种英语不好、但是又需要阅读论文的人。

本文就结合最近几个月阅读论文采的坑与《How to Read a Paper》结合,摸索一下大佬们的阅读方法。

一般的机器学习工程师或者深度学习工程师,都要阅读大量的论文积累相关的领域知识。但是阅读论文本身却很少有人能传授一些经验,这篇文章提出了一种“三步法(three-pass method)”的方法,下面就来介绍一下。

背景

通常会有很多原因需要阅读论文,比如回顾某个会议或者课程、对某个领域持续的关注、开拓新的领域等等。一个专业的学术研究员或者AI研究员可能需要花费几百个小时来阅读论文,因此高效的阅读论文,是一种必不可少的经验和技能。对于刚开始阅读论文的人来说,需要经过不断的尝试和犯错,才能总结出经验和教训。作者凭借多年的阅读经验,总结出了阅读论文的“三步法”,下面就来看看到底是如何操作的吧。

三步法

阅读论文最笨拙的方法就是从头读到尾,有的时候浪费了大量的时间还不知道作者到底说了什么。如果采用三步法,一般是这么个流程:

  • 第一步,对论文的主题,对论文的核心内容有一定的了解
  • 第二步,了解论文的核心思想
  • 第三步,深入理解论文、尝试复现

第一步

通过快速的浏览论文,对论文有一个整体的了解,然后决定是否有必要继续深入阅读。这个阶段大概花费5-10分钟,主要会做下面的事情:

  • 1 仔细阅读标题、摘要和介绍
  • 2 粗略的阅读小节部分
  • 3 浏览一下数学公式,对基本的理论有一定的把握
  • 4 阅读结论
  • 5 浏览相关引用,剔除读过的文章

通过这个阶段,检查一下自己能否回答下面几个问题:

  • 1 分类方面:这篇文章属于那种类型?这篇文章的结论是通过什么指标衡量的?是否有现成的系统参考?是否有基础的模型理论参考?
  • 2 内容方面:其他的论文有没有跟这个类似的?这篇论文有没有什么参考的核心理论?
  • 3 准确性方面:这篇论文的结论可信吗?
  • 4 贡献度方面:这篇论文有什么新的想法?
  • 5 清晰度方面:这篇论文写得好吗?容易理解吗?

通过上面的信息,你就可以决定是否要继续深入下去了。如果这篇文章你压根不感兴趣,或者你暂时还不能理解它,又或者认为作者的结论是错误的,那就没必要继续阅读了。也可以把它暂时放在一边,过一段时间再来考虑要不要继续阅读。

另外,如果你也许要写论文,那么通过这个部分你应该也能了解到哪一部分是最重要的。首先一定要保证标题和副标题的连贯性、摘要的清晰程度,不然阅读者很有可能阅读完摘要、扫过标题后,就放弃阅读了。

第二步

在第二步中,需要阅读的更仔细点,但是可以把论证的部分给去掉。在阅读的时候可以划重点、抓关键词进行标记,也可以把阅读时不理解的地方记下来。这样再次阅读的时候就可以多注意和思考这些问题,自己写论文的时候也会更注意到类似的点。

  • 1 仔细的阅读论文中的图片、表格以及其他说明,尤其是要注意图片,标注的信息是否正确?有没有标错?可信么?如果发现错误,那么这篇文章很有可能不是什么好文章。
  • 2 标记那些引用的还没阅读的论文,这样可以通过一篇论文在领域内引申开,扩大对领域知识的了解。

第二个阶段大概需要花费一个小时的时间来仔细阅读,通过这个步骤就可以抓住论文的核心内容了。你可以尝试总结一下论文的主要内容、支撑的论点等等。

有时经过这个阶段还是对论文不理解,这有可能是因为刚刚接触这个领域,对于很多的概念和新名词都不了解,或者作者使用的一些论点论据难以理解,也可能是作者对于一些关键点没有描述清楚。那么你可以选择:

  • 1 把这篇论文先放在一边,希望你自己的工作或者科研不会用到相关的内容
  • 2 先阅读一下相关的背景资料引用论文,再回来看看
  • 3 尝试进行第三个步骤

第三步

为了更好的了解论文中的内容,最关键的就是第三步了,这一步需要读者尝试复现论文。假设你现在有了跟作者一样的思路,那么如何来复现它?通过复现的过程,就能轻松的理解文章的核心点,并且发现一些隐藏的坑和结论。

这一步就需要更加关注论文的细节了,需要理解和挑战论文中的每一个结论,甚至你可以自己想想有没有其他的思路。通过这种方式,就可以把一些虚拟的经验变成自己的真实经验了。对于现在这个开放的互联网时代,最简单的办法就是去github里面搜搜有没有现成的代码,直接阅读别人公开的源码。

这个步骤可能会花费几个小时、几天甚至几个月。经过这个阶段,你可以轻松的在脑海中重现整个论文的思路和结构,你也能抓住论文隐藏的结论,论文之外的工作,实验过程中潜在的问题以及分析的方法。

最后

阅读论文总的来说还是一个经验活,最起码需要有几十篇的阅读量,才能进入一个陌生的领域。通过这个“三步法”,你可以快速的判断这篇论文是否值得深入阅读,是否是你感兴趣的话题。

对于如何扩展知识、怎么筛选论文,可以通过下面的方法。

  • 首先需要一个学术性的搜索引擎,比如Google学术、CiteSeer,输入3-5个关键词进行搜索。
  • 然后通过快速通读论文,了解论文的相关工作。
  • 接下来,可以通过搜索作者的明细,查找他的其他文章,加入阅读列表中。
  • 查看关键作者最近的发表以及相关的顶级会议,一般能发表到顶级会议的论文都属于质量很高的论文。
  • 最后关注顶级会议最近的录入论文,快速浏览相关的内容,能帮你了解相关领域的发展情况。

希望读者都能在自己感兴趣的领域快速积累起来,未来也会持续的关注爱可可老师的微博,真的很有用!

参考

How to Read a Paper
爱可可老师的微博

原文地址:https://www.cnblogs.com/xing901022/p/10161727.html

时间: 2024-10-11 01:44:52

想要接触人工智能吗?先要学会如何阅读论文的相关文章

【原创】连“霍金”都想学习的“人工智能”---【自己动手写神经网络】小白入门连载开始了(1)

欢迎关注[自己动手写神经网络]的博客连载!!! 第1章 神经网络简介 神经网络这个词,相信大家都不陌生.就在你打开本书,并试图了解神经网络时,你已经在使用一个世界上最复杂的神经网络——你的大脑,一个由大约1000亿个神经元(每个单元拥有约1万个连接)构成的复杂系统.但人的大脑太过复杂,以至于科学家们到目前为止仍然无法准确解释大脑的工作原理和方式.但有幸的是,生物神经网络的最最基本的元素已经能够被识别,而这就构成了本书想为你介绍的人工神经网络(Artificial Neural Network).

连“霍金”都想学习的“人工智能”---【自己动手写神经网络】小白入门连载开始了(1)

欢迎关注[自己动手写神经网络]的博客连载!!! 第1章 神经网络简介 神经网络这个词,相信大家都不陌生.就在你打开本书,并试图了解神经网络时,你已经在使用一个世界上最复杂的神经网络--你的大脑,一个由大约1000亿个神经元(每个单元拥有约1万个连接)构成的复杂系统.但人的大脑太过复杂,以至于科学家们到目前为止仍然无法准确解释大脑的工作原理和方式.但有幸的是,生物神经网络的最最基本的元素已经能够被识别,而这就构成了本书想为你介绍的人工神经网络(Artificial Neural Network).

陈记抄 同学 说 “想弄清楚量子力学,就只能学会波动方程”, 这话我可不爱听了

陈记抄 同学 在 <关于反相> http://tieba.baidu.com/p/6377776028   说 “想弄清楚量子力学,就只能学会波动方程”, 这话我可不爱听了   . 我用   En = A / n²   ,  A 为 常数 ,  这个公式 可以 轻松 的 计算出 电子能级轨道,   波函数 的 积分 结果 无非也就是  En = A / n²   , 所以 绕了一大圈, 又绕回来了 . 原文地址:https://www.cnblogs.com/KSongKing/p/12055

想要转人工智能,程序员该如何学习?(转)

对于程序员来说,码农之路并不是一帆风顺.对于每一个入行IT业的社会青年来说,谁不是抱着想要成为最高峰的技术大咖或者跃进管理岗的小目标?然而往往更多的人并非互联网吹捧的如此耀眼,仿佛每一个程序员都是世界的领头人,身怀绝技,社会的弄潮儿,其实普遍都是借此糊口的普通人. 每天工作内容就是跟其他程序员讨论.编写代码.熬夜编写代码.解决BUg.和用户沟通.Diss产品以及被老板Diss,不知道那一天才能被伯乐赏识,从此万事无忧. 但是还没等到伯乐,你的年龄越来越大,身体渐渐发福,开始发现自己已经不能像两三

《Entity Framework 6 Recipes》中文翻译系列 (40) ------ 第七章 使用对象服务之从跟踪器中获取实体与从命令行生成模型(想解决EF第一次查询慢的,请阅读)

翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 7-5  从跟踪器中获取实体 问题 你想创建一个扩展方法,从跟踪器中获取实体,用于数据保存前执行一些操作. 解决方案 假设你有如图7-7所示的模型. 图7-7. 包含实体Technician和ServiceCall的模型 在这个模型中,每个技术员(technician)都有一些业务服务请求(service call),业务服务请求包含联系人姓名,问题.使用代码清单7-4,创建一个扩展方法获取

想靠人工智能实现IPO,搜狗故事里缺的不只是创新

"已经没有人怀疑搜狗的生存问题了,惟一的悬念是搜狗能否在搜索领域实现颠覆,是否能在AI领域引领重大的创新".在搜狗创始人兼CEO王小川8月发布的这封计划赴美IPO的内部信中,其自定义的搜狗风险在于创新和颠覆,而搜狗的机遇则在人工智能(AI)之上. 10月13日晚间,搜狗向美国证券交易委员会提交招股说明书,人工智能成为了整个招股书里最大的关键词,共被提及90次,战略规划的五分之三都是在说大数据和人工智能. 成立于2004年8月的搜狗终于要上市了,而且势必成功,只不过王小川用来吸引资本市场

专访吴恩达:我不关心人工智能是否变邪恶

专访吴恩达:我不关心人工智能是否变邪恶 可以说,这几所大学有着最赞的计算机科学课程:卡耐基梅隆大学.麻省理工学院.加州伯克利以及斯坦福.这些地方,分别是吴恩达获得学士学位.硕士学位.博士学位和执教12年的地方. 吴恩达是人工智能界的标杆,实至名归,他甚至还没到40岁.2011年,他成立了谷歌大脑,一个因谷歌强大的计算能力和大量的数据而大放异彩的深度学习项目.当计算机分析了许多的YouTube截屏并能够识别出一只猫时,谷歌大脑普大喜奔地迎来了它最重要的成就之一.(<纽约时报>以「需要多少台电脑才

从零开始学习开发人工智能(一)

关于学习如何开发人工智能.我从今天开始,将开始学习如何开发人工智能.我将会从最基础的内容开始学起. 这一次,我们开发一个真正的人工智能.我们需要学会的内容有: 编程语言:C# 建模引擎:Maya 游戏引擎:Unity3D 混合现实与全息投影:HoloLens开发 人工智能:机器学习.深度学习.神经网络.自然语言处理 人工智能框架:ML.NET(微软推出的本地人工智能框架).WindowsML(微软内置的AI框架) 数据库:SQL Server 网站开发框架:ASP.NET(此处我们开发项目网站需

想做web前端工程师应该学习些什么?

偶然间看到这篇文章,感觉博主写的挺不错的,如果你想做web前端工程师的话,建议您阅读以下这篇文章,其实web前端工程师所做的工作其实就是网站设计,有些小公司的美工其实就是做web前端的.这篇文章对于想学web前端工作的人有很大的帮助,如果您是做SEO的,也建议您学习下博主推荐的这些课程,或许对你以后的职业.薪资都有很大的帮助! 遇到很多新手,都会问,如果要学习web前端开发,需要学习什么?难不难?多久能入门?怎么能快速建一个网站?工资能拿到多少?还有些让我推荐一些培训机构什么的要去学习.我建议是