几个新角色:数据科学家、数据分析师、数据(算法)工程师

大数据分析的几个新角色:数据科学家、数据分析师、数据(算法)工程师

数学科学家:(发明算法)

运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才。

对享有的模型进行优化、改进,所以涉及到对具体算法的精通和理解,并不断通过AB Test进行验证。

例如:Google的搜索PageRank算法的创始人拉里佩奇Larry Page,他是博士而且在读书期间创造的此算法。

李开复也应该算一个,解决中文搜索及尝试了语音识别的关键技术算法。

还有我司的客户信用评分模型也是MIT的高端开发设计出来的。

近期我们还没有应用或者发展到这个阶层,很少需要修改或者创造算法和模型来解决问题的层面,主要还在算法应用层面。

关键要求:IT技术知识,例如对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能;

数学、统计、数据挖掘,可以使用SAS、R等挖掘工具并对统计算法足够掌握;

数据可视化能力,可以把复杂的模型和数字逻辑通过易懂直观的展示方式

标杆人才:虚位以待,还有可能就是2012的诺亚方舟的。

数据(算法)工程师:(使用算法)

深刻理解统计学及挖掘分析工具的开发工程师,可以通过数据,借助工具和建模开发,解决一类业务问题的工程师。

关键时候需要客户化算法、修改算法解决关键问题。

关键要求:对统计学或者数学有一定理论背景,知道什么是逻辑回归,什么是T/F检验;

代码或模型开发能力,最好包括大规模非结构化数据处理能力;

特定行业和领域应用的经验会加速数据算法的开发和应用。

标杆人才:潘柱新+陈国富,他俩结合起来应该是我认识最牛的算法工程师了。

数据分析师:(使用数据)

数据分析师能洞悉一个方程式的商业意义。他们知道如何提出正确的问题,搜罗和管理相关的数据,通过数据探索和分析,佐以数据可视化、数据呈现或分析报告解决问题。

关键要求

除了对数据的理解和把握,懂业务和懂工具(Excel、SQL是基础,SAS、SPSS是进阶等数据分析相关的工具)之外,还有两个容易被忽视的技能

懂分析:指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。

基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

懂设计:懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图表的选择(什么时候用柱状图、什么时候用折线图,这是最基本的能力)、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。特别是42公里的漫长、富有创新的数据价值发现之旅,不能毁在最后一公里的呈现和报告中。

标杆人才:潘旭(即熟悉信用业务;又可以熟练使用分析方法;

懂一些SAS的工具;还懂可视化、图表、版式等高体验性设计),DMP项目中数据管理部的王刚也在成长中。

时间: 2024-10-08 09:45:00

几个新角色:数据科学家、数据分析师、数据(算法)工程师的相关文章

python、数据分析师、算法工程师的学习计划

1.前言 最近(2018.4.1)在百忙之中开通了博客,就喜欢能够把自己所学所想沉淀下来,这篇是我开始系统学习python,称为数据分析师和算法工程师之路的计划,望有志于为同样目标奋斗的数据猿一起交流和学习. 2.Python学习计划 2.1 学习计划 (1)找一本浅显易懂,例程比较好的教程,从头到尾看下去.不要看很多本,专注于一本. (2)去找一个实际项目练手.(参照Crossin的编程教室-Python入门,Python的练手项目) 2.2 学习资料 零基础入门书籍:<简明python教程>

工程师及数据科学家的大数据学习路径

https://www.jianshu.com/p/260fd0f9ada6https://www.codingke.com/question/16483 原文地址:http://blog.51cto.com/881206524/2308479

分辨真假数据科学家的20个问题及回答

分辨真假数据科学家的20个问题及回答 2016-11-14 大数据文摘 [导语]本文分为两个部分,第一部分是quora上很火的一篇问答--[20个分辨真假数据科学家的问题]中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章[KDnuggets编辑们针对这20个问题给出的回答].前者由大数据文摘团队选稿翻译校对后,呈现在各位读者面前.后者授权转载自计算广告(Comp_Ad)译者白雪.龙星镖局,原载于KDnuggets.本次将分散于不同地址的相关资源整合推送,希望更有利于有兴趣

关于数据科学家现状的分析

从Kaggle上获取的这份数据集,是从超过15000个专业的数据科学家收集的数据,让我们对他们的偏好.工作.学习资源和技术水平有了一个非常好的了解. 以下的分析中,简单的从几个方面对数据科学家的现状进行分析. 我们有超过16716人的数据.由于问题的数量实在是太大了(总共超过300个),所以指望人们回答所有的问题是不现实的.换句话说,我们的大多数数据点都是空的. 从以下几点进行分析 性别 让我们看看回答者的性别比例 我们发现,我们的调查对象绝大多数都是男性.这反映了数据科学和一般技术领域的一个非

如何区分三个大数据热门职业——数据科学家、数据工程师、数据分析师

随着大数据的愈演愈热,相关大数据的职业也成为热门,给人才发展带来带来了很多机会.数据科学家.数据工程师.数据分析师已经成为大数据行业最热门的职位.它们是如何定义的?具体是做什么工作的?需要哪些技能?让我们一起来看看吧. 1.这3个职业是如何定位的? 数据科学家是指能采用科学方法.运用数据挖掘工具对复杂多量的数字.符号.文字.网址.音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师). 数据工程师是如何定义的 数据工程师一般被定义成"深刻理解统计学科的

如何区分三个大数据热门职业–数据科学家、数据工程师、数据分析师?

随着大数据行业的逐步兴起,相关大数据的职业也成为热门职业,给人才的发展带来了很多机会.数据科学家.数据工程师.数据分析师已经成为大数据行业最热门的职位.那么它们又是如何定义的呢?有什么职责? 1.数据科学家是指能采用科学方法.运用数据挖掘工具对复杂多量的数字.符号.文字.网址.音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师). 2.数据工程师一般被定义成“深刻理解统计学科的明星软件工程师”.如果你正为一个商业问题烦恼,那么你需要一个数据工程师.他

数据分析师(Data Analyst),数据工程师(Data Engineer),数据科学家(Data Scientist)的区别

数据分析师(Data Analyst):负责从数据中提取出有用的信息,以帮助公司形成业务决策.工作内容包括:对数据进行提取,清洗,分析(用描述统计量,趋势分析,多维度分析,假设检验等统计常用方法对数据进行分析),总结结论并提出建议.数据分析师通常从业务团队那里获取需要分析的具体问题,并提供相应的解决方案.高级数据分析师还需要了解各种模型(如线性回归,决策树等),并能调包实现这些模型. 需要掌握的技能有:熟悉业务,会使用excel,ppt等基本工具,了解统计分析方法,会使用SQL从数据库提取数据,

如何成为一名数据科学家?

数据科学(Data Science)是从数据中提取知识的研究,关键是科学.数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机 编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算.数据科学并不局限于大数据,但是数 据量的扩大诚然使得数据科学的地位越发重要.    数据科学的从业者被称为数据科学家.数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题.不远的将来,数据科学家们需要精通一门.两门

从本科生到数据科学家,为啥这个职业门槛高?

参与文末话题讨论,每日赠送异步图书 --异步小编 William  Chen是Quora的一位数据科学家,在那里他协助Quora发展壮大,为这个世界分享知识.在拿到哈佛大学的统计和应用数学双学位之后,他直接成了一位数据科学家,也是世界上第一批在校期间接受了完整的数据科学课程并且最终在毕业之后直接加入了数据科学领域的学生之一.全职加入Quora之前,他曾经在Quora和Etsy做数据实习生.他很喜欢讲述各种与数据有关的故事,并且也在Quora上广泛地分享他的知识. William也是<数据科学家访