机器学习英雄访谈录之 Kaggle Kernels 专家:Aakash Nain

目录

  • 机器学习英雄访谈录之 Kaggle Kernels 专家:Aakash Nain

    • 正文
    • 对我的启发

机器学习英雄访谈录之 Kaggle Kernels 专家:Aakash Nain

Sanyam Bhutani 是 Medium 上一位专注 ML 和 CV 的博主,本系列翻译自他进行的系列采访——《机器学习英雄访谈录》。

学习从模仿开始,要模仿就要模仿那些最棒的人,这是我开始本系列的初衷。


正文

这次我采访的是 Aakash Kumar Nain,一位 Kaggle kernel 专家、数据科学家、深度学习工程师。


Sanyam: 嗨,Aakash,感谢你接受这次采访。

Aakash: 嗨,Sanyam,谢谢你能想到我。

Sanyam: 你是我认识的最酷的印度大学生之一,你能向读者介绍下你自己吗?

Aakash: 谢谢你的称赞。好吧,我的职业是一名数据科学家。我喜欢用机器学习来解决复杂的问题。玩数据是我的另一个爱好,计算机视觉是我最喜欢的领域。Python 是我生命中唯一的真爱。除此之外,我是一个运动员,足球运动员、业余旅行者和狂热的阅读者。哲学是继计算机科学之后我第二热爱的学科。

Sanyam: 了不起,我知道你也吸合法的数据科学“粉儿”——Kaggle。你能告诉我们一些你的 Kaggle 之旅吗?是什么让你对 AI 如此感兴趣,以至于你决定把它作为职业生涯?

Aakash: 哈!是的,你说的对,我完全沉迷于此。我的 Kaggle 之旅与大多数人有点不同。我在大学前的最后一年,我的一位前辈向我展示了使用强化学习训练的自主马里奥游戏。在那个时候真的让我大吃一惊。我开始学习机器学习的在线课程。问题是,没有一门课程能为你提供复杂问题的实践经验。那时我听说有 Kaggle。我在 2016 年 1 月加入 Kaggle。一开始,我感到完全没有头绪,我暂时没有参加任何比赛。在练习了一些小而简单的问题后,我于 2016 年 7 月参加了比赛。我加入了 Kaggle Noobs 社区,并开始向人们提出非常棒的问题,以澄清并深入了解一些基本概念。从那以后,这段旅程开始变得非常有趣。

Sanyam: 我非常喜欢从你的 kernel 中学习。你能告诉我们更多关于写作动机的事吗?一个人背后付出了多少努力?

Aakash: 数据科学和机器学习是广阔的领域。对于初学者来说,这条路几乎总是艰巨的,这是我的个人经历。分享知识是自学的重要部分。此外,我们有责任回馈一直为你服务的社区。这正是我开始编写 kernel 的原因。每次我编写 kernel 时,我都会确保它包含其他人尚未尝试过的新内容。

关于这些努力,我想说编写高质量的 kernel 需要付出巨大的努力。例如,我可以在几个小时内编写一个简单的kernel,但为了确保代码整洁、优化,并与最佳实践一致,可能需要数天时间。

Sanyam: 我知道来自 AI 职位稀缺的同一个国家,是什么让你决定把它作为你的职业选择?

Aakash: 当你在找工作时,你应该经常考虑两件事:

  1. 你的个人兴趣
  2. 你的工作范围和成长率

你应该做你喜欢的工作。当我在大学时,我学习编程是因为我当时想成为一名核心开发人员,然后我尝试了网络编程,但没有什么能比机器学习更令我兴奋。就在那时,我决定只在数据科学和机器学习领域工作。

Sanyam: 我认为我们俩都同意印度的机器学习机会目前非常稀缺。你对想在该领域工作的新人有什么建议?

Aakash: 我会纠正第一个观点“印度的机器学习机会目前非常稀缺”。这并不意味着突破口不存在。问题是每个人都希望成为机器学习工程师,每个公司都希望在他们的工作中应用机器学习,因为他们认为它很“酷”。最重要的是,即使公司本身不知道机器学习是做什么的,工作要求也包括“5 年以上的机器学习经验”。所以,问题在于另一方面。

我已经说机器学习是一个广阔的领域。机器学习涉及多个学科,如计算机视觉、自然语言处理、语音等。不要试图成为每个学科的专家。每个子领域都非常多样化,在一个子域内有太多东西需要学习。你应该选择最感兴趣的一个,但同时你应该知道其他子域中使用的基本概念。

Sanyam: 从我们之前的谈话中,我们都同意在线学习作为硕士学位的替代同样好,甚至更好。你能分享一下你的想法吗?你是否认为 Kaggle 可以为你提供比硕士学位更好的数据科学职位?

Aakash: 今天互联网上有两种类型的在线课程。第一个是涵盖“广度”的那些,而第二个是涵盖“深度”的那些。例如,Udacity 课程涵盖宽度。他们会教你几乎所有方面的课程,但没有一个会被深入介绍。另一方面,如果你希望深入研究某些方面,coursera 课程是很好的,但它们不会涵盖所需的每个要素。这是当前的主要瓶颈。对于在线课程来说,要在一个地方查找学习所需的所有内容有点困难。再加上什么都不便宜。在线课程并不像硕士学位那样昂贵,但是依然价格昂贵。

参加 Kaggle 比赛和选择硕士学位是两件完全不同的事情。前者使你更善于尝试不同的事物,并被更广泛的受众所认可,而后者则会让你能更好地研究。有些人喜欢再次上大学,而其他人更喜欢实践经验和日常解决问题。

Sanyam: 在我们结束之前,还有什么想对读者说的吗?

Aakash: 考虑到我们在过去几年中在机器学习方面取得的进步,特别是在深度学习方面,我们正生活在一个令人难以置信的时代。当你自学成才时,事情会更加大不相同。成为机器学习工程师或数据科学家的道路很简单,但成为一名非常优秀的机器学习工程师或数据科学家的道路并不容易。在某个时间点,你会因为看到当前研究的数量(如此之多)而感到消沉。如果你有这种感觉,没关系。我们应该永远记住两件事:

  1. 你的成功不依赖于他人,反之亦然。
  2. 永远不要害羞和害怕去问那些甚至是最基本的问题。如果你不问,你就是自己的绊脚石。

KaggleNoobs slack 是最好的联系方式。虽然,我在 Twitter 上也很活跃,但我根本不使用 Twitter 进行通信。

Sanyam: 感谢你在此次采访中的谈话。


Kaggle Noobs 是 Kaggle 最棒的社区,在那里可以找到 Aakash、Kaggle Grandmasters、Masters、Experts,并且它甚至对我这样的菜鸟新手也很友好。

如果你想成为 Aakash 那样的专家,尽管加入吧。

对我的启发

  • 分享知识是自学的重要部分。
  • 我们有责任回馈一直为你服务的社区。
  • 前面两点可以结合在一起。
  • 不要试图成为每个学科的专家,要一专多能

原文地址:https://www.cnblogs.com/xuruilong100/p/10188120.html

时间: 2024-11-14 03:07:25

机器学习英雄访谈录之 Kaggle Kernels 专家:Aakash Nain的相关文章

机器学习英雄访谈录之 DL 自由职业者:Tuatini Godard

目录 机器学习英雄访谈录之 DL 自由职业者:Tuatini Godard 正文 对我的启发 机器学习英雄访谈录之 DL 自由职业者:Tuatini Godard Sanyam Bhutani 是 Medium 上一位专注 ML 和 CV 的博主,本系列翻译自他进行的系列采访--<机器学习英雄访谈录>. 学习从模仿开始,要模仿就要模仿那些最棒的人,这是我开始本系列的初衷. 正文 今天我们要采访的是 Tuatini Godard.我的好朋友,一位来自法兰西的的深度学习自由职业者. Sanyam:

机器学习英雄访谈录之 DL 实践家:Dominic Monn

机器学习英雄访谈录之 DL 实践家:Dominic Monn Sanyam Bhutani 是 Medium 上一位专注 ML 和 CV 的博主,本系列翻译自他进行的系列采访--<机器学习英雄访谈录>. 学习从模仿开始,要模仿就要模仿那些最棒的人,这是我开始本系列的初衷. 今天采访的是 Dominic Monn,一位伟大的领袖.缔造者.社区领导者.自驾车工程师和远程工作的 DL 工程师.1 Sanyam: 嗨,Dominic!感谢你接受这次采访,我很高兴能够采访你. Dominic: 嗨,Sa

《Python机器学习及实践:从零开始通往Kaggle竞赛之路》

<Python 机器学习及实践–从零开始通往kaggle竞赛之路>很基础 主要介绍了Scikit-learn,顺带介绍了pandas.numpy.matplotlib.scipy. 本书代码基于python2.x.不过大部分可以通过修改print()来适应python3.5.x. 提供的代码默认使用 Jupyter Notebook,建议安装Anaconda3. 最好是到https://www.kaggle.com注册账号后,运行下第四章的代码,感受下. 监督学习: 2.1.1分类学习(Cla

“机器学习”相关资料分享

近年来人工智能与VR正在变得越来越火,特别是当alphago以绝对优势战胜围棋大师李世石之后,更是炒热了"机器学习"这个概念.国际人工智能专家.百度首席科学家吴恩达教授在今年四月份的"机器学习研究会"上这样说到: 在中国,每天都有500人死于车祸.我们的无人驾驶技术早实现一天,就相当于多拯救了500人的生命,这将会是接下来的十年中,人工智能得到的最重要的应用之一. 我想和在座的年轻人说几句话.我们处在一个独特的时期,这是一个人工智能将会改变世界的时期.如果你知道怎么

教你如何在机器学习竞赛中更胜一筹

更多技术干活请关注:阿里云云栖社区 - 汇聚阿里技术精粹 作者:Team Machine Learning,这是一个机器学习爱好者团队,他们热衷于建立一个有希望在数据科学/机器学习方面建立事业的有抱负的年轻毕业生和专业人士的环境. 介绍 机器学习很复杂.你可能会遇到一个令你无从下手的数据集,特别是当你处于机器学习的初期. 在这个博客中,你将学到一些基本的关于建立机器学习模型的技巧,大多数人都从中获得经验.这些技巧由Marios Michailidis(a.k.a Kazanova),Kaggle

Kaggle初学者五步入门指南,七大诀窍助你享受竞赛

Kaggle 是一个流行的数据科学竞赛平台,已被谷歌收购,参阅<业界 | 谷歌云官方正式宣布收购数据科学社区 Kaggle>.作为一个竞赛平台,Kaggle 对于初学者来说可能有些难度.毕竟其中的一些竞赛有高达 100 万美元的奖金池和数百位参赛者.顶级的团队在处理机场安全提升或卫星数据分析等任务上拥有数十年积累的经验.为了帮助初学者入门 Kaggle,EliteDataScience 近日发表了一篇入门介绍文章,解答了一些初学者最常遇到的问题.机器之心对这篇文章进行了编译介绍,另外也增加了一

Atitit 项目中的勋章体系,,mvp建设&#160;,荣典体系建设

Atitit 项目中的勋章体系,,mvp建设 ,荣典体系建设 1. 荣典体系的标准1 2. 勋章称号1 2.1.1. 授予标准1 3. 政出多门  统一的荣誉制度 2 3.1. 法则规定2 3.2. 福利 2 3.3. 勋章样式2 4. 建立全球统一的荣典体系2 4.1. 巡回演讲,宣传布道3 5. 八个不同的核心驱动力.3 5.1. Core Drive 1: Epic Meaning & Calling(史诗意义&使命感):做比自己更重要的事情!3 1. 荣典体系的标准 德治,绩效,管

初探Spark

众所周知,目前大数据时代数据分析处理最常提到的是两个框架,一是Hadoop,另一个无疑便是Spark,Spark基于map reduce算法实现的分布式计算,虽然拥有着Hadoop的优点,但是关于这个架构网上的解释并不全面,此次王家林老师带我们从技术的角度去探索一下Spark. 第二代大数据技术Spark  首先先来抛开这两种技术,谈一下大数据.大数据是数据的一种,数据处理到达一定复杂程度,或者数据规模到达一定程度的时候便会称之为大数据.在采访中王家林讲到:“其实关于大数据的处理本身包含两部分,

2017年暑假 杭电计划

马上要在杭电读过我研究生阶段第一个暑假,虽然杭电并不是特别好的学校,放眼全国他的计算机也不是一个特别牛的专业,但是也给了我足够大的发展空间. 第一个暑假预计有两个半月(如果期间不回家),大约是6月27日-9月15日,这个阶段主要是研究生阶段学习的适应期,并且搞清楚自己想要什么,该做什么,跟着老师确定接下来几年的发展方向. 就现在看来我想做的有: 1.算法与英语基础 LeetCode 算法+sql 看看英语 2.机器学习 加强 3.数学  结合机器学习 最优化 统计学??? 4.kaggle竞赛