为什么数据科学家们总是在离职的路上

相信在这个时代的当下,大家或多或少都有看到过类似“数据科学是21世纪最性感工作”的故事,以及数据科学家在这个时代显得是一份十分理想且具有超强吸金能力的工作。因为这个领域需要大量高技能人才,他们需要寻求解决复杂问题的办法(这对于“极客”来说是一件很有吸引力的好事)。总之,大家的描述都让这份工作在技术人的眼中显得十分梦幻、可爱。

但事实是,正如英国《金融时报》在这篇文章中所说,数据科学家通常“每周花1-2小时寻找新工作”。此外,文章还指出,“机器学习专家在说他们正在寻找一份新工作的开发人员中排名第一,占14.3%。数据科学家紧随其后,占13.2%,“这些数据是在他们对64000名开发者的调查中通过堆栈溢出的方法收集的。

作为数据科学从业人员,我也一直有着这样的状态和想法。

那么为什么有这么多数据科学家在寻找新的工作呢?

在回答这个问题之前,我应该澄清一点,我仍然是一名数据科学家。总的来说,我很喜欢这份工作,我不想让其他人不想成为数据科学家,因为这份工作真的是有趣的、刺激的和有意义的。本文的目的是扮演一个魔鬼的倡导者并袒露这项工作的一些消极方面。

从我的角度来看,许多数据科学家对他们的工作不满意主要有以下4个原因:

1.期望与现实不符

Big data is like teenage sex: everyone talks about it, nobody really
knows how to do it, everyone thinks everyone else is doing it, so
everyone claims they are doing it… — Dan Ariely

这句话非常贴切。我所知道的许多初级数据科学家(包括我自己)都想进入数据科学领域,因为它是一种通过酷炫的机器学习算法来解决复杂问题的方法,这些算法对业务将会产生巨大的影响。这是一个让我们觉得我们所做的工作比以前做过的任何事都重要的机会。但是,现实往往与我们想象的相去甚远。

在我看来,期望与现实不符是许多数据科学家选择离开这个领域的最终原因。

每个公司都有所不同,所以我不能代表所有的公司,但许多公司雇用数据科学家但却没有适当的基础设施来支持从AI中获取价值。这有助于AI中的冷启动问题。再加上这些公司在雇用应届生之前没有聘请资深/经验丰富的数据从业者这一事实,这也是导致双方都失望和不满的原因之一。数据科学家可能是希望来编写智能机器学习算法来提高洞察力的,但实际工作中却无法做到这一点,因为他们的第一项工作是整理数据基础架构和/或创建分析报告。相比之下,公司只想要一张他们每天可以在董事会会议上出现的图表。

Robert Chang在他的博客文章中给出了一个对于年轻数据科学家非常有见地的建议:

重要的是要评估我们的愿望与我们所处环境的关键路径是否一致。寻找那些关键路径与你最为一致的项目、团队和公司。

这突出了雇主和数据科学家之间的双向关系。如果公司的位置不匹配,或者与数据科学家的目标不一致,那么数据科学家跳槽真的只是时间问题。

数据科学家们幻想破灭的另一个原因就是:我相信我做的事情能够对这个世界产生影响,而不仅仅是在公司内部。实际上,如果公司的核心业务不是机器学习(我以前的雇主是媒体出版公司),那么你所做的数据科学很可能只能提供少量的增量收益。那种你做的事情是一个项目中非常重要、不可获取的一部分,或者你可能很幸运地遇到了一个非常棒的项目的机会的情况并不常见。

2、公司需求占主导地位

如果你认真地认为知道很多机器学习算法将使你成为最有价值的数据科学家,那么回到我的第一点:期望与现实不符。

事实上,如果希望公司老板或业界专业人士对你有一个好印象,这可能意味着你必须经常做一些特别的工作。比如从数据库中获取数据,以便在正确的时间提供给合适的人员,做一些简单的项目。在我以前的地方,我不得不这么做。尽管这话说出来令人沮丧,但这是工作的必要部分。

3、你什么都知道

为了让老板们满意,数据科学家们不得不什么都做。因为对于老板和同事而言,他们真的对于“数据科学家”究竟是做什么的,完全没有概念。他们认为你就是做数据分析,并且把这些分析结果以报告形式呈现给老板的人。

不仅仅是非技术人员对你的技能做了太多的假设。其他技术领域的同事也将会认为你知道所有与数据相关的事情。比如他们觉得你应该是熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP等等任何你能想到的机器学习的技能的(以及任何你能想到的其他相关数据——顺便说一句,如果你看到一个包含所有这些内容的工作要求,请你清醒点!因为这意味着这份工作要求来自一家不知道自己的数据策略是什么的公司,他们会雇佣任何人,因为他们认为雇佣任何数据人员都能解决他们所有的数据问题)。

这样的臆断还没有结束!你的老板和同事们不仅认为你知道所有的数据算法,同时还有你还应该可以得到所有公司内外的数据,通过……emmm,我相信作为数据工作者的你,应该5分钟前在你的邮箱中看到过类似的要求。

试图去告诉每个人你能做的和正在做的事情其实是很难的。这并不是因为有人会真的看不起你,而是因为作为一个缺乏行业经验的初级数据科学家,你会担心大家看不起你。这其实挺矛盾的。

4、在一个独立的团队中工作

当我们看到成功的数据产品时,我们经常会看到专业设计的具有智能功能的用户界面,其中最重要的是,它会有一个有价值的输出,让用户感知到我们为他解决了一个问题。而如今,如果一个数据科学家只把时间花在学习如何编写和执行机器学习算法上,那么在一个能够成功地开发出一个有价值产品的团队中,他们就只能是其中最基础和底层的部分(尽管是必要的)。

尽管如此,许多公司仍然拥有数据科学团队,他们会提出自己的项目并编写代码来尝试解决问题。在某些情况下,这就足够了。例如,如果所需要的只是一个每季度生成一次的静态电子表格,那么这些行为可以提供一些价值。另一方面,如果目标是在定制的网站构建产品中优化提供智能建议,那么这将涉及许多不同的技能,这是绝大多数数据科学家不应该奢望的(只有真正的数据科学独角兽才能解决这个问题)。因此,如果这个项目是由一个独立的数据科学团队承担的,那么它很可能会失败(或者需要很长时间,因为在大型企业中组织独立的团队从事协作项目并不容易)。



因此,要成为行业中拔尖的数据科学家,仅仅在Kaggle竞赛中取得好成绩并完成一些在线课程是不够的。幸运/不幸的是,(这取决于您如何看待它),它涉及到理解企业中的制度规则和一些工作环境上的软技能。在寻找一份能满足你需求的数据科学工作时,找到一家与你的职业规划路径一致的公司应该是一个关键目标。然而,你可能仍然需要重新调整对数据科学角色的期望。

原文链接

以上信息来源于网络,由“京东云开发者社区”公众号编辑整理,不代表京东云立场。

原文地址:https://www.cnblogs.com/jdclouddeveloper/p/11673065.html

时间: 2024-11-12 06:51:09

为什么数据科学家们总是在离职的路上的相关文章

42步进阶学习—让你成为优秀的Java大数据科学家!

作者 灯塔大数据 本文转自公众号灯塔大数据(DTbigdata),转载需授权 如果你对各种数据类的科学课题感兴趣,你就来对地方了.本文将给大家介绍让你成为优秀数据科学家的42个步骤.深入掌握数据准备,机器学习,SQL数据科学等. 本文将这42步骤分为六个部分, 前三个部分主要讲述从数据准备到初步完成机器学习的学习过程,其中包括对理论知识的掌握和Python库的实现. 第四部分主要是从如何理解的角度讲解深入学习的方法.最后两部分则是关于SQL数据科学和NoSQL数据库. 接下来让我们走进这42步进

自学成才的数据科学家告诉你5个学习大数据的正确姿势!

对于数据科学来说,现在是发展的黄金时期.这是个新领域,但增长迅速,同时数据科学家的缺口也很大,据说他们的平均年薪可以达到10万美元.哪里有高薪,哪里就吸引人们,但是数据科学技能的差距意味着许多人需要努力学习.      第一步当然是询问“我怎么学习数据科学”,这个问题的答案往往是一长串的课程和书籍阅读,从线性代数到统计数据,这几年我也是这样学习过来的.我没有编程背景,但我知道我喜欢处理数据. 我比较不能理解在完全没有理解别人的背景时就给他一份长长的书单或者技能表.这就类似于一个老师给你一堆教科书

数据科学家应该掌握的5个工具

本文转自:http://www.36dsj.com/archives/34020 当谈及到分析你编纂的数据时,有大量的工具可以帮助你更好的理解数据,本文总结出了一个包括5个数据科学工具的列表,同时这也是你在当今的社会形势下人们应该掌握的5个数据科学工具. 即使是知识渊博的数据科学家也能提升他们的技术水平.当谈及到分析你编纂的数据时,有大量的工具可以帮助你更好的理解数据.我们与我们的数据科学指导者探讨了很久,最后总结出了一个包括5个数据科学工具的列表,同时这也是你在当今的社会形势下应该掌握的5个数

为什么数据科学家们选择了Python语言?

本文由 伯乐在线 - HanSir 翻译,toolate 校稿 英文出处:Quora [伯乐在线导读]:这个问题来自 Quora,题主还补充说,“似乎很多搞数据的程序员都挺擅长 Python 的,这是为什么呢?”下面是 Jeff Hammerbacher 的回复.(693 赞) Python是一种解释型.动态语言,具有明确而高效的语法.Python具有良好的REPL(Read-Eval-Print Loop ,‘读取-求值-输出’循环),还可以通过dir()和文档字符串从REPL中开发新模块.这

基于100,000篇演讲的分析数据科学家发现了最佳演讲者的特征——及时解释听众不懂的词语,必要时提高10%的音调,正确和恰当的手势,氛围的营造

[TD精选] 基于100,000篇演讲的分析数据科学家发现了最佳演讲者的特征 相信大部分人一定试图寻找过使得自己的演讲变得更加吸引人,更加有气势的方法.现如今,在大数据工具和机器学习技术的辅助下,找到完美演讲的答案已经变得十分容易.Noah Zandan, CEO of Quantified Communications, 为人们提供了第一个能够分析,衡量,评估以及提高人们交流和演讲技巧的分析平台.Zandan 的数据团队分析了100,000多篇来自于企业家,政治家和演说家的演讲.他们将分析重点

几个新角色:数据科学家、数据分析师、数据(算法)工程师

大数据分析的几个新角色:数据科学家.数据分析师.数据(算法)工程师 数学科学家:(发明算法) 运用统计分析.机器学习.分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才. 对享有的模型进行优化.改进,所以涉及到对具体算法的精通和理解,并不断通过AB Test进行验证. 例如:Google的搜索PageRank算法的创始人拉里佩奇Larry Page,他是博士而且在读书期间创造的此算法. 李开复也应该算一个,解决中文搜索及尝试了语音识别

成为数据科学家并不难

几个菜鸟程序员在Coursera上免费注册学习了几天"机器学习"课程后,赢下了Kaggle预测模型建模大赛. 企业界在IT业制造的大数据人才恐慌(麦肯锡是始作俑者)中纷纷提高了对大数据和高级分析人才的期待和要求,数据科学家也一夜之间成为最性感的职业,其光环直追体育明星.数据科学家被描绘成神一般的人物,他们通晓数学.计算.社会学.物理学等各学科知识,同时又洞察世事,深谙企业运作之道,存世数量堪比特级珍稀保护动物.这些都让有志从事大数据分析的IT从业人员高山仰止,望而止步. 但越来越多的证

数据科学家可能成为2015年最热门职业

腾讯科技讯 1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌? 如果你拥有这样的技能集,那你就有可能当上数据科学家.而如果你当上了数据科学家,那你的日子就可以过得风风光光了--LinkedIn的最新投票结果显示,"统计分析和数据挖掘" 是2014年最大的求职法宝. 美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元).麦肯锡公司的一份研究预测称,到2

数据科学家:神话 & 超能力持有者

一个打破神话的季节,正在降临. 我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,宛如将一个又一个的玻璃瓶子摔碎在墙壁上一样. 关于数据科学家的神话主要是这些:        神话#1: 数据科学家们本身就是一种神奇生物,就像独角兽一样神奇叵測. 数据科学家实际上是很真实的.从人们開始进行多元统计分析.时间序列分析和运用其它核心分析方法时,他们就已经存在了.在某种程度上,假设你建立模型,并使用各种分析工具来找寻那些不显著的数据模型,那么你也许也是一位数据科学家