数据科学家:神话 & 超能力持有者

一个打破神话的季节,正在降临。

我将坦诚地揭穿人们关于数据科学家所持有的惯有看法。在下文中,我将一个一个展示这些观点,犹如将一个又一个的玻璃瓶子摔碎在墙壁上一样。

关于数据科学家的神话主要是这些:

       神话#1: 数据科学家们本身就是一种神秘生物,就像独角兽一样神秘叵测。

数据科学家实际上是非常真实的。从人们开始进行多元统计分析、时间序列分析和运用其他核心分析方法时,他们就已经存在了。在某种程度上,如果你建立模型,并使用各种分析工具来找寻那些不显著的数据模型,那么你或许也是一位数据科学家了。

       神话#2: 数据科学家门只是一群稀有的“精英”理论家。

实际上,数据科学家们只是那些在勤奋工作的白领们的一种。每天,他们洁净的指甲因为大量地移动来自世界各地的原始数据而污迹斑驳,这些数据需要倾倒到分析沙漏中,清洗和筛选,最终才能找到可能存在的模型。当新的数据出现时,又会再次被倒入到沙箱中,循环之前的过程。这是一项极其细致、繁重的工作,他们并不是只坐在扶手椅上思考的数据哲学家。

     神话#3: 数据科学家是某种新时尚,很快就会消失。

“数据科学家”这个包罗万象的名称,已经存在许多年了,各种先进的分析工具——统计分析、数据挖掘、预测建模以及更久远的分析工具都可以归入其中。在过去的几年中,分析专家们越来越倾向于使用“数据科学家”这个名称来指代引入了新规则的不同学科的融合,例如行为分析、情感分析和图标分析——在这个数字渠道与传媒盛行的时代中,“数据科学家”便顺理成章地成为了炙手可热的宠儿。而数字科学家们的工作日程也随之日趋增多,与之相关的专业论坛和学术课程在过去几年中正以不可否认的速度增长着。目前的招聘趋势也再次证明了这一点。这不是时尚而已。

神话#4: 数据科学家都是未任职的统计学博士或粒子物理学家。

当然,许多数据科学家第一次进行数据分析、建模还是在大学中。但很多人之后又运用这些知识去继续学习了实质性的学科,例如,工商管理、经济学、金融和工程学。您在工作领域所遇到的大多数数据科学家实际上是业务领域的专家,而不是对数学痴迷的“宽克”或者对算法狂热的的“行家”。他们只是对统计建模十分精通。

       神话#5: 数据科学家只是长期的商业智能(BI )专家,雇主给他们一个漂亮的称号来代替加薪。

当然,许多长期的BI高级用户在某种程度上就是数据科学家,他们是业务领域的专家,工作涉及了多变量分析、预测、假设建模和仿真。那些希望更深入地进入到细分、决策树分析、倾向建模、预测分析和其他数据科学技术的人也在重新塑造自己。但是绝大多数传统的BI专家们,它们主要是专注于历史的,描述性分析,他们也从来没有掩饰自己不属于数据专家。尽管如此,许多人知道如果不跟上与大数据科学相关的Hadoop,预测建模和图标分析的话,它们很容易被行业淘汰。

       神话#6: 数据科学家从任何意义上来说都不是科学家。

每一个真正的科学家也一定是数据科学家的一种,虽然不是所有宣称自己是数据科学家的人真的名副其实。真正的科学家必须要观测数据。如果没有精细的筛选、选择、构建、分类、分析,最终呈现数据的能力,科学家将不能把对于事实本质的调查联通起来,正如批评家所说,没有深入到数据中心的科学家不能有效地捍卫他所发现的东西。统计管理是真正的科学的基石,同样,实验控制是许多学科的标志;如果数据科学家在探索诸如人们购买习惯这样的问题,运用了统计管理和实验控制来证明了他们的发现,那么他们已经是平凡而简单的数据科学家了。

       神话#7数据科学家需要花哨的,昂贵的,复杂程度令人咂舌的统计学工具才能完成他们的工作。

这绝对不是事实。从根本上来说,数据科学家的工作是去寻找隐藏的模式。他们通过友好用户可视化工具,通过自助的搜素式BI工具, 通过交互式数据开采工具,以及其他一些不需要深入掌握统计分析的就可运用的方式来完成自己的研究。在市场上,价格划算的探索性工具BI有许多的供应商,例如IBM Cognos. 全球业务分析超级用户可以从一个植入在普通电子表格中的应用程序的模型特性中得出非凡的见解。

      神话#8数据科学家仅仅是把大量数据扔入到Hadoop集群中,然后再利用Pig and MapReduce的分布式计算,最终,令人大呼过瘾的见解就会宛如喷泉般得涌出。

欧,兄弟!数据科学家将会第一个告诉你,Hadoop只是一个用于深入探索的平台。Hadoop的能力其实与企业数据仓库、传统的数据挖掘平台以及其他的数据库内分析平台别无二样。这些可不是是什么通灵牌——大数据的精灵会开口与我们这些凡人说话呢。Hadoop和其他数据平台只是一个用于分析的工作平台,数据科学家可以借助它来进行深度的数据调查。

(注:本文由OCCS软件云工厂编译,转载请注明出处。)

时间: 2024-12-29 09:52:26

数据科学家:神话 & 超能力持有者的相关文章

数据科学家:神话 & 超能力持有者

一个打破神话的季节,正在降临. 我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,宛如将一个又一个的玻璃瓶子摔碎在墙壁上一样. 关于数据科学家的神话主要是这些:        神话#1: 数据科学家们本身就是一种神奇生物,就像独角兽一样神奇叵測. 数据科学家实际上是很真实的.从人们開始进行多元统计分析.时间序列分析和运用其它核心分析方法时,他们就已经存在了.在某种程度上,假设你建立模型,并使用各种分析工具来找寻那些不显著的数据模型,那么你也许也是一位数据科学家

【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake

摘要: 近日,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics,Data Lake Analytics,帮助更多不具备分析能力的存储服务,赋予其分析的能力. 近日,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics,Data Lake Analytics,帮助更多不具备分析能力的存储服务,赋予其分析的能力. 从生活中的购物交易,到工业上的生产制造,再到社交网络媒体信息.企业化管理决策等等,大数据成为当前经济社会最重要的前进

自学成才的数据科学家告诉你5个学习大数据的正确姿势!

对于数据科学来说,现在是发展的黄金时期.这是个新领域,但增长迅速,同时数据科学家的缺口也很大,据说他们的平均年薪可以达到10万美元.哪里有高薪,哪里就吸引人们,但是数据科学技能的差距意味着许多人需要努力学习.      第一步当然是询问“我怎么学习数据科学”,这个问题的答案往往是一长串的课程和书籍阅读,从线性代数到统计数据,这几年我也是这样学习过来的.我没有编程背景,但我知道我喜欢处理数据. 我比较不能理解在完全没有理解别人的背景时就给他一份长长的书单或者技能表.这就类似于一个老师给你一堆教科书

数据科学家应该掌握的5个工具

本文转自:http://www.36dsj.com/archives/34020 当谈及到分析你编纂的数据时,有大量的工具可以帮助你更好的理解数据,本文总结出了一个包括5个数据科学工具的列表,同时这也是你在当今的社会形势下人们应该掌握的5个数据科学工具. 即使是知识渊博的数据科学家也能提升他们的技术水平.当谈及到分析你编纂的数据时,有大量的工具可以帮助你更好的理解数据.我们与我们的数据科学指导者探讨了很久,最后总结出了一个包括5个数据科学工具的列表,同时这也是你在当今的社会形势下应该掌握的5个数

几个新角色:数据科学家、数据分析师、数据(算法)工程师

大数据分析的几个新角色:数据科学家.数据分析师.数据(算法)工程师 数学科学家:(发明算法) 运用统计分析.机器学习.分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才. 对享有的模型进行优化.改进,所以涉及到对具体算法的精通和理解,并不断通过AB Test进行验证. 例如:Google的搜索PageRank算法的创始人拉里佩奇Larry Page,他是博士而且在读书期间创造的此算法. 李开复也应该算一个,解决中文搜索及尝试了语音识别

数据科学家可能成为2015年最热门职业

腾讯科技讯 1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌? 如果你拥有这样的技能集,那你就有可能当上数据科学家.而如果你当上了数据科学家,那你的日子就可以过得风风光光了--LinkedIn的最新投票结果显示,"统计分析和数据挖掘" 是2014年最大的求职法宝. 美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元).麦肯锡公司的一份研究预测称,到2

????????数据科学家

励志篇:IT屌丝如何成为数据科学家? 数据科学家 风格 7个月前 (09-26) 1359浏览 0评论 数据科学家被<财富>杂志誉为21世纪最性感的职业,但遗憾的是大多数企业里都没有真正的数据科学家人才.根据麦肯锡报告,仅仅在美国市场,2018年大数据人才和高级分析专家的人才缺口将高达19万.此外美国企业还需要150万位能够提出正确问题.运用大数据分析结果的大数据相关管理人才. 那么,对于不同职业经历和专业背景的IT人士来说,如何才能尽快转型,加入数据科学家的钻石王老五的行列呢? Ofer M

分辨真假数据科学家的20个问题及回答

分辨真假数据科学家的20个问题及回答 2016-11-14 大数据文摘 [导语]本文分为两个部分,第一部分是quora上很火的一篇问答--[20个分辨真假数据科学家的问题]中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章[KDnuggets编辑们针对这20个问题给出的回答].前者由大数据文摘团队选稿翻译校对后,呈现在各位读者面前.后者授权转载自计算广告(Comp_Ad)译者白雪.龙星镖局,原载于KDnuggets.本次将分散于不同地址的相关资源整合推送,希望更有利于有兴趣

如何区分三个大数据热门职业–数据科学家、数据工程师、数据分析师?

随着大数据行业的逐步兴起,相关大数据的职业也成为热门职业,给人才的发展带来了很多机会.数据科学家.数据工程师.数据分析师已经成为大数据行业最热门的职位.那么它们又是如何定义的呢?有什么职责? 1.数据科学家是指能采用科学方法.运用数据挖掘工具对复杂多量的数字.符号.文字.网址.音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师). 2.数据工程师一般被定义成“深刻理解统计学科的明星软件工程师”.如果你正为一个商业问题烦恼,那么你需要一个数据工程师.他