几个月就能化身为数据科学家?

关于做一名数据科学家,我有一些想法。成为一名数据科学家并不容易,需要付出很多努力,但如果你对数据科学充满兴趣,那一切都是值得的。

时常有人问我:如何成为一名数据科学家?必修的课程是什么?需要多长时间?你是怎么成为数据科学家的?我已多次回答过这些问题。所以在我看来,写一篇汇总的文章也许能帮助那些想要成为数据科学家的人。

关于我自己

我(俄罗斯,莫斯科)在密歇根州立大学经济学院获得硕士学位,并在 ERP 系统规划领域做了 4 年的分析师和顾问。我的工作涉及与客户交谈,讨论他们的需求并将其落地,编写文档,向程序员说明任务,测试结果,组织项目和许多其它事情。

这是一项压力很大的工作,需要处理很多问题。更重要的是,我并不喜欢它。尽管我喜欢处理数据,但我做的大多数事情还是令人索然无味。所以,在 2016 年的春夏之交,我开始另谋出路。我通过了精益六西格玛(Lean Six Sigma)的绿带测试,但还未找到新的就业机会。有一天我发现了大数据(BigData)。在 google 上搜索和阅读了许多文章后,我意识到这可能是我的梦想职业。

我辞去工作,并在八个月后在一家银行找到了第一份数据科学家的工作。从那之后,我先后就职了几家公司,但我对数据科学的热情日益增加。我完成了一些关于机器学习和深度学习的课程,实践了一些项目(如聊天机器人或数字识别 APP),先后参加了许多机器学习的比赛和活动,在 Kaggle 上获得了三枚银牌。总之,我有一些学习数据科学和作为数据科学家工作的经验。当然,我还有很多技能需要学习。

免责声明

本文所述仅为我自己的观点。可能有些人会对其中的内容持反对态度,但我无意冒犯任何人。我认为想成为一名数据科学家必须投入大量的时间和精力,否则将一事无成。Course 或 MOOC 声称可以让你在几周或几个月内成为机器学习/深度学习/数据科学专家的广告语并不是真的。你可以在数周/数月内获得一些知识和技能。但如果没有广泛的实践(大多数课程内不包含这一部分),你无法真正掌握它。

你确实需要内在的动力,但更重要的是,你需要严格地规范自己,这样你可以在动力消失后继续努力。

再说一遍——你需要自己动手动脑。如果你在提出最基础的问题之前没有用 Google/ StackOverflow 或思考几分钟,那你将永远无法赶上专业人士。

在我参加的大多数课程中,只有大约 10-20%的人完成了这些课程。半途而废的人基本都缺乏耐心和决心。

什么样的人能成为数据科学家?

上图显示了数据科学家所需的一些核心技能,比如:数学和统计学,编程和开发,领域相关知识和软技能。

这么多技能!怎么可能完全掌握呢?嗯,需要花费很多时间。但告诉你一个好消息:没必要掌握全部。

2018 年 10 月 21 日,Yandex 上有一个有趣的演讲,其中提到数据科学专家类型有很多,他们只是拥有上述技能中的某几种而已。

数据科学家应该处于图片中间的位置,但实际上他们可以处于三角形的任何位置,不同位置对应了不同的专家能力。

在本文中,我将讨论的一类数据科学家是那些可以与客户交谈,进行分析,构建模型并实施项目的人。

转行?这意味着你已有所了解!

有人说转行相当困难。虽然这是事实,但转行也通常意味着你对现在工作已经有所了解。也许你有编程和开发经验,也许你在数学/统计学领域工作过,或者你每天锻炼你的软技能。至少你拥有一些自己领域的专业知识。你可以扬长避短。

来自 Reddit 的数据科学路线图

实际上这里有两个路线图:)

第一个来自 Reddit:

首先,阅读 Hastie、Tibshirani 和 Jerome Friedman 所著的《The Elements of Statistical Learning》第 1-4 章和 7-8 章。就算暂时不理解,也要坚持阅读。

如果需要,你可以阅读该书的其它部分。假设你对全书都已有所了解。

观看 Andrew Ng 的 Coursera 课程。用 python 和 R 语言完成所有练习。确保你能写出正确答案。

然后阅读一本深度学习书。在 Linux 系统中运行 tensorflow 和 pytorch 框架并实践示例项目,直到完成。尝试使用卷积神经网络、循环神经网络和前馈神经网络。

完成所有这些后,继续在 arXiv 上阅读最新的有用论文。文献不断在更新,所以要跟上大部队。

完成这些的你现在会被大多数公司录取。如果你需要完善简历,可以参加一些 Kaggle 比赛。如果你有调试问题,请使用 StackOverflow。如果在数学方面有问题,请多读文献。如果生活上问题,自己看着办吧。

原文地址:https://www.cnblogs.com/chuangye95/p/10204534.html

时间: 2024-10-07 18:28:05

几个月就能化身为数据科学家?的相关文章

7月21日 企业大数据平台仓库架构建设思路直播视频

7月21日 企业大数据平台仓库架构建设思路--李金波(阿里云高级技术专家) 采访:我们该如何做好一个数据仓库? 演讲视频:https://yq.aliyun.com/edu/lesson/119 演讲整理文章:https://yq.aliyun.com/articles/57901 PDF下载:点此进入 现场问答整理:https://yq.aliyun.com/ask/36706/ 更多技术峰会视频资料详见:https://yq.aliyun.com/articles/57826 阅读原文请点击

为什么数据科学家们选择了Python语言?

本文由 伯乐在线 - HanSir 翻译,toolate 校稿 英文出处:Quora [伯乐在线导读]:这个问题来自 Quora,题主还补充说,“似乎很多搞数据的程序员都挺擅长 Python 的,这是为什么呢?”下面是 Jeff Hammerbacher 的回复.(693 赞) Python是一种解释型.动态语言,具有明确而高效的语法.Python具有良好的REPL(Read-Eval-Print Loop ,‘读取-求值-输出’循环),还可以通过dir()和文档字符串从REPL中开发新模块.这

成为数据科学家并不难

几个菜鸟程序员在Coursera上免费注册学习了几天"机器学习"课程后,赢下了Kaggle预测模型建模大赛. 企业界在IT业制造的大数据人才恐慌(麦肯锡是始作俑者)中纷纷提高了对大数据和高级分析人才的期待和要求,数据科学家也一夜之间成为最性感的职业,其光环直追体育明星.数据科学家被描绘成神一般的人物,他们通晓数学.计算.社会学.物理学等各学科知识,同时又洞察世事,深谙企业运作之道,存世数量堪比特级珍稀保护动物.这些都让有志从事大数据分析的IT从业人员高山仰止,望而止步. 但越来越多的证

数据科学家可能成为2015年最热门职业

腾讯科技讯 1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌? 如果你拥有这样的技能集,那你就有可能当上数据科学家.而如果你当上了数据科学家,那你的日子就可以过得风风光光了--LinkedIn的最新投票结果显示,"统计分析和数据挖掘" 是2014年最大的求职法宝. 美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元).麦肯锡公司的一份研究预测称,到2

????????数据科学家

励志篇:IT屌丝如何成为数据科学家? 数据科学家 风格 7个月前 (09-26) 1359浏览 0评论 数据科学家被<财富>杂志誉为21世纪最性感的职业,但遗憾的是大多数企业里都没有真正的数据科学家人才.根据麦肯锡报告,仅仅在美国市场,2018年大数据人才和高级分析专家的人才缺口将高达19万.此外美国企业还需要150万位能够提出正确问题.运用大数据分析结果的大数据相关管理人才. 那么,对于不同职业经历和专业背景的IT人士来说,如何才能尽快转型,加入数据科学家的钻石王老五的行列呢? Ofer M

想从事数据科学家的自我修炼(浪叫兽的书单)一年之内从零基础入门(以不抱大腿的姿势)拿下数据竞赛 一等奖 ,二等奖,三等奖

携程赛的初练书单 在科赛网站上,我第一次报名参加了比赛是,酒店未来30天产量预测,当时参加比赛是16年的7月中旬了.距今日的17年5月中旬,不到一年的时间,在科赛网,同样是在携程的出题下拿到了一个冠军一等奖 进入正题把,我来写一下我的历史读书记录  和  自发学习过程: 其实刚刚入门是因为想玩爬虫爬新闻做预测:入门读的书有: PYTHON自然语言处理中文翻译 NLTK 中文版quantmod-R中的金融分析包R数据导入和导出(包括RODBC)RODBC中文介绍上面可能也是一些介绍把 了解了一下R

如何成为一名数据科学家?

数据科学(Data Science)是从数据中提取知识的研究,关键是科学.数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机 编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算.数据科学并不局限于大数据,但是数 据量的扩大诚然使得数据科学的地位越发重要.    数据科学的从业者被称为数据科学家.数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题.不远的将来,数据科学家们需要精通一门.两门

从本科生到数据科学家,为啥这个职业门槛高?

参与文末话题讨论,每日赠送异步图书 --异步小编 William  Chen是Quora的一位数据科学家,在那里他协助Quora发展壮大,为这个世界分享知识.在拿到哈佛大学的统计和应用数学双学位之后,他直接成了一位数据科学家,也是世界上第一批在校期间接受了完整的数据科学课程并且最终在毕业之后直接加入了数据科学领域的学生之一.全职加入Quora之前,他曾经在Quora和Etsy做数据实习生.他很喜欢讲述各种与数据有关的故事,并且也在Quora上广泛地分享他的知识. William也是<数据科学家访

开源工具Arena,数据科学家再也不用为Kubernetes犯难啦!

2018年7月,阿里云将深度学习工具Arena贡献给了开源社区,数据科学家无需学习底层IT资源使用,即可在云端运行深度学习,一分钟内启动深度学习任务,十五分钟内创建异构计算集群. 为什么要有Arena这样的工具? 现在Kubernetres社区最流行的深度学习解决方案是KubeFlow,Arena是不是又重新造了个轮子?KubeFlow是基于Kubernetes构建的可组合,便携式, 可扩展的机器学习技术栈,支持实现从JupyterHub模型开发,TFJob模型训练到TF-serving,Sel