数据分析的能力体系和进阶路线

数据分析是一个被广泛使用的技能标签。在真实工作环境下,至少有三个类型的职位可以算作和数据分析师相关,分别是:BI (Business Intelligence), QA (Quantitative Analyst / Data Scientist), 以及BA (Business Analyst)。

a) BA首先定义业务的度量方式,比如付费用户还是活跃用户,1天日活重要还是30天日活重要。然后收集数据进行各维度的分析,比如地域、渠道、用户行为等等。

b) 基于QA在BA分析的基础上,搭建分析模型,里面可能用到各种统计、优化、机器学习方法。模型经过A/B测试、稳定性等评估,预计带来的影响。

c) BI负责将BA和QA定义的所有用户度量,市场趋势,模型表现等通过数据库和SQL完成自动计算、定期自动更新及可视化展现,成为部门每天都会关注的核心数据。

由此大家可以看出,BA/ QA/ BI之间是各有侧重的: Business Analyst 定义问题,分析数据,提出并部分实现解决方案; Quantitative Analyst 定义模型和架构,实现完整的解决方案; Business Intelligence 对数据和度量进行可视化展示、自动化计算和更新。

各自需要什么能力?

回到基础,无论是BI、QA、BA都需要基本的数据分析技能,不同的是后续的技术和业务侧重略有不同,下面提供一份数据分析的进阶路线。

数据分析学习路线

1、Excel

Excel一般人都有接触过,重点是了解各种函数,如sum,count,sumif, countif,find,if,left/right,时间转换等;但函数不需要学全,掌握一些最常用的的,其它在用到的时候随搜随用就行。另外vlookup和数据透视表是两个性价比很高的技巧,这两个搞定后,一般10万条以内的数据统计基本没什么难度了。

2、数据可视化

数据分析界有一句经典名言,字不如表,表不如图。数据分析的最终都是要兜售自己的观点和结论的,兜售的最好方式就是做出观点清晰数据详实的PPT给老板看。

虽然Excel也可以完成很多的数据可视化功能,但是如果想要得到更专业的可视化效果,还是建议学些编程方面的知识。

这里推荐微软的Power BI(商业智能)和帆软的FineBI。BI和图表的区别在于BI擅长交互和报表,适合解释已经发生和正在发生的数据。Power BI适合个人学习,FineBI适合企业级的应用。

Power BI

3、数据库

Excel对十万条以内的数据处理起来没有问题,但是互联网行业就是不缺数据。但凡产品有一点规模,数据都是百万起,这时候就需要学习数据库。SQL是数据分析的核心技能之一,从Excel到SQL绝对是数据处理效率的一大进步。

除了最基本的增删改查、索引、约束外,主要了解where,group by,order by,having, like,count,sum, min,max, distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。如果想要跟进一步,可以学习row_number,substr,convert,contact等。再有点追求,就去了解Explain优化,了解SQL的工作原理,了解数据类型和IO。

4、R/Python语言

是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘,爬虫,可视化报表都需要用到编程能力。而数据分析领域推荐使用的两种语言绝对是R和Python了,二者在数据分析领域的地位可以说是旗鼓相当,各有优势。

R的优点是统计学家编写的,如果是各类统计函数的调用,绘图,分析的前验性论证,R无疑有优势。学习R,需要了解数据结构(matrix,array,data.frame,list等)、数据读取,图形绘制(ggplot2)、数据操作、统计函数(mean,median,sd,var,scale等);开发环境建议使用Rstudio。

Python则是万能的胶水语言,适用性强,有很多分支,我们专注数据分析这块。需要了解调用包、函数、数据类型(list,tuple,dict),条件判断,迭代等;开发环境建议Anaconda。

5、统计知识

统计学是数据分析的基础。需要花一些时间掌握描述性统计知识,包括:均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念。

6、分析思维

好的数据分析首先要有结构化的思维,也就是我们俗称的金字塔思维。思维导图是必备的工具;之后再了解SMART、5W2H、SWOT、4P理论、六顶思考帽等框架。分析也是有框架和方法论的,主要围绕三个要点展开:

1)一个业务没有指标,则不能增长和分析;

2)好的指标应该是比率或比例;

3)好的分析应该对比或关联。

7、业务知识(用户行为、产品、运营)

对于数据分析师来说,业务其实比了解数据方法论更重要。但很遗憾,业务学习没有捷径,必须靠在某个行业一点点积累。

时间: 2024-10-10 21:19:08

数据分析的能力体系和进阶路线的相关文章

Java架构师之路:从Java码农到年薪八十万的架构师,最牛Java架构师进阶路线

从Java码农到年薪八十万的架构师,资深架构师大牛给予Java技术提升学习路线建议,如何成为一名资深Java架构师? 对于工作多年的程序员而言,日后的职业发展无非是继续专精技术.转型管理和晋升架构师三种选择.架构师在一家公司有多重要.优秀架构师需要具备怎样的素质以及架构师的发展现状三个方面来分析 程序员如何才能晋升为优秀的高薪架构师? 希望通过本文让程序员们了解架构师的市场行情,了解架构师的发展前景,并帮助你更清晰地做出职业规划. 架构师在一家公司有多重要 架构师在公司中担当着「IT架构灵魂人物

CRM提高客户数据分析工作能力

?互联网时代企业能够不明白繁杂的优化算法,对数据却要维持高宽比比较敏感.不断提高自身的数据统计分析工作能力才可以顺应潮流发展趋势.客户是企业关键資源,对客户资料的初中级解决能够进行基础业务流程全过程,对数据的高級解决能够出示企业管理决策适配.推动销售.维持销售人群的平稳.CRM能够协助企业提高客户数据分析工作能力.CRM遮盖全客户生命期能够将CRM系统软件了解变成一个数据库查询,储放着企业从推广渠道得到的客户案件线索,最后交易量客户的信息和销售全过程中增加的信息,企业依据这种数据能够统计分析客户

php自学提升进阶路线

为了自己对php的系统全面深入的掌握,我通过个人经验,以及搜索网上高手经验,汇总了一份php自我学习路线规划,包括实战演练.学习建议.高手进阶.常见问题和测试总结五块.算是一个系统的学习计划和目标吧.避免盲目学习,对提高有所指引.希望自我加压,通过努力修炼达到高手水平.天道酬勤,自我勉励!此路线仅适合我本人. 部分摘自博客,参看:[原创]PHP程序员的技术成长规划 http://blog.csdn.net/heiyeshuwu/article/details/40098043这个php成长规划清

产品经理能力体系

1. 学习能力(Learning Ability) 有些东西不懂很正常,从不懂到懂,从懂到精通,自己想想,原来不会的东西,是否可以很快上手.学习能力,其实蛮难衡量,我更愿意看到产品经理在每次产品项目实践中的总结归纳,清楚的知道成功经验与失败教训. 2. 执行力(Execution) 完成预定目标及任务的能力,包含完成任务的意愿,完成任务的方式方法,完成任务的程度.这对于产品新人来说,或许是最重要的,刚刚开始步入职场,没啥决策权,先按照领导要求做出来吧,当然,做之前,自己可以有个决策判断,产品出来

性能测试工程师的能力要求以及学习路线

很多学员都会问:1.如何才能成为NB的性能测试工程师?2.成为性能测试工程师都学习什么啊?3.loadrunner我需要学习到什么程度啊?............ 如何才能找到答案呢,我们根据岗位要求去完善和构建整个性能测试工程师的能力要求体系. 首先:分析性能测试工程师的岗位要求其次:根据岗位要求分析出能力要求然后:根据能力要求分析出知识要求最后:根据知识要求梳理学习体系 根据思路我收集整理了现有的市面上招聘所有的性能测试工程师的岗位需求(招聘网站)所有的性能测试工程师的岗位要求,根据这些岗位

Java程序员进阶路线-高级java程序员养成

1. 引言 搞Java的弟兄们肯定都想要达到更高的境界,用更少的代码解决更多的问题,用更清晰的结构为可能的传承和维护做准备.想想当初自己摸着石头过河,也看过不少人介绍的学习路线,十多年走过来多少还是有些收获.现通过自身经历总结一篇文章,供弟兄们参考. 2.  用好正在用的框架 在已经加入的团队中,和大家协作使用团队已选好的框架.不管框架优劣与否,特点如何,选择了它必然有一定的道理.并且能够在业界经久流行的框架也一定有它的优秀之处. 使用框架第一步是熟悉,可能通过复制和修改前人的代码来实现新的功能

01机器学习算法整体知识体系与学习路线攻略

入行机器学习有一年多了,做过大大小小的机器学习项目,参加数据竞赛等实践活动,从最初的懵懵懂懂到现在逐步的深入,也渐渐的有了很多的体会和理解,本篇文章主要来阐述机器学习的知识体系,以让更多人明白机器学习应该怎样学习.需要学习什么?这些问题就是本篇文章的主要讨论的内容,下面开始进行详细介绍. 先对本篇文章的目录做个介绍: 1.机器学习术语 2.常见算法类型 3.评估方法和指标 4.性能优化和超参数调优 1.机器学习术语 接下来正式介绍机器学习术语.机器学习术语作为作为最基本的常识问题,为了更好的学习

iOS进阶路线以及进阶书籍

第一,熟悉ARC机制:首先要了解ARC的前世今生:如果了解不清楚会导致两种可能,1,一个对象的引用莫名奇妙为空,或失效了.这个一般都能在开发阶段及时发现,因为会导致应用异常.2,导致内存溢出:不了解ARC机制很容易导致内存不能被正确释放,这类问题会很隐蔽.若非特意去做内存测试,那么都会在用户使用的阶段才会被暴露出来,因为内存消耗是个累积的过程,用户不断使用APP,至到内存耗尽,异常退出. 第二,了解Block的用法:我使用后的感受是,可以把一个操作的不同结果的处理放在一起,而不用分散到各处:逻辑

Android学习进阶路线Android源码分享)

毕业8月有余,同时伴随着从事的Android经验的提升.仔细思量过去的工作内容,掐指算来也是少得可怜---主要维护FM收 音机模块,间或看看Lancher模块的代码.尽管这样,总的来说,在这八个月事件的学习里,我自我感觉收获还是很大的---自学了很多 Android相关方面的知识.虽然里真正的大牛还有很远的一段路程要走,自己也会坚持学习.坚持走下去. 再次,把自己学习过程中总结的一些经验总结出来,帮助那些刚刚步入Android的网友以及有了取得了一些经验但不知如何 继续前行的朋友,希望你们能够早