在学习数据分析知识的过程中发现了一个七周成为数据分析师课程班,讲解的比较基础和全面,相对于常见的一些数据分析课程,突出的优点在于它把重心放在了数据分析的思维和业务能力,更加符合实际需求。毕竟对于数据分析师来说,最难的地方在于思维业务能力,否则只会使用各种各样炫酷的软件代码而不知所措。
这里记录一下七周成为数据分析师课程的学习笔记,教学视频是在万能的b站上发现的。可能涉及到版权原因这里就不贴上链接。
对应的文字教学资料可以查看:互联网数据分析能力的养成,需一份七周的提纲——秦路
接下来是第一周的课程内容:数据分析思维
三种核心思维:结构化、公式化、业务化?
1. 结构化
一个好的分析思维应该是结构化的,充满逻辑性和美感的,具有明确的方向性和目的性。
1) 归纳
结构化思维(金字塔):将分析思维结构化,层层递进+拆解
- 将论点归纳和整理
- 将论点递进和拆解
- 将论点完善和补充
2) 步骤
- 核心论点:寻找金字塔的塔顶,可以是假设/问题/预测/原因
- 结构拆解:自上而下将核心论点层层拆解为分论点。上下之间呈因果/依赖关系
- MECE:各论点之间相互独立,完全穷尽,避免交叉和重复,分论点尽量完善
- 验证: 不论是核心论点还是分论点,都应该是可量化的,可验证的
3) 示例
这里课程举例为:结构化思维分析近期销量下降原因
自己尝试做了一个简单分析,如下:
老师随后做的分析如下:
笔记:
1. 自己做的练习,遗漏了一个很重要的,根据空间维度进行划分来分析销量下降原因。
时间维度和空间维度是两个常用的分析角度,销量下降在时间纬度上可能和其他外部因素有关也更繁杂,但空间维度是最显著能用于思维角度划分的。
2. 自己做的练习,各论点的分列不够完善,缺少相应业务知识。
2. 公式化
结构化思维固然重要,但它有自身明显的缺点:结构化思维提出的猜想难以用数据来验证,并且各论点间可能其实是相互交叉的, 不能被严格分列。
这里引入公式化的思维方式,两个重点在于:一切结构皆可量化+最小不可分割。
1) 公式化:一切皆为公式
- 销售额 = 销量 * 客单价
- 利润 = 收益 - 成本
- 销售额 = 每个产品销售额总和
- 地区销量 = 各渠道销量总和
- 销量 = 人均销量 * 购买人数
2) 以销售额为例
3) 加减乘除
- 不同类别的业务叠加可以用加法
- 业务见的逻辑关系用减法
- 计算各种比例用乘除法
4) 修改销量影响结构化图
3. 业务化
举例:如何测算上海投放共享单车量
- 从城市流动人口计算:假设共一千万流动人口,骑行共享单车转化率为1%
- 从人口密度计算:商业区/住宅区
- 从城市交通数据计算:公交/地铁站点,流动人数
- 从保有自行车量计算
- 单车有损耗,计算时应该考虑单车的损耗因素
前两个思维方式,结构化+公式化,可能更多的是在抽象层面上为了分析而去分析,缺少对业务的深入理解。
用结构化思考+公式化拆解获得的最终分析论点,很多时候是现象。数据是某个结果的体现,但不代表原因。
好的数据分析思维,本身也需要具备业务思维。
数据分析的思维技巧
结构化+公式化+业务化三种核心思想是框架型的指引,实际应用中也应该借助思维的技巧工具,达到四两拨千斤的效果。而且他们应该足够简单和有效。
1. 象限法
将数据/原因/问题进行象限划分归类,每一类间的各成分相似,不同类间相异(聚类)。
- 核心:策略驱动
- 优点:直观清洗对数据进行人工划分,划分结果可以直接用于策略
- 须知:象限划分可以按中位数、平均数,或是经验(并不限定,依实际情况决定)
- 应用:适用范围广,如战略分析、产品分析、市场分析、客户管理等
2. 多维法
将数据/事件/用户用多个纬度进行划分,依赖于大数据量
- 用户统计纬度:年龄、性别
- 用户行为纬度:注册用户、用户偏好、用户兴趣、用户流失
- 消费纬度:消费金额、消费频率、消费水平
- 商品纬度:商品品类、商品品牌、商品属性
这部分类似于结构化思维,将事件从多个维度进行考虑
- 核心:精细驱动的思维
- 优点:处理大数据量、纬度丰富且复杂的数据有较好的效果。但是纬度过多,消耗时间大
- 须知:对不同维度进行交叉分析时,需要注意辛普森悖论
- 应用:只要数据齐全丰富均可应用
3. 假设法
很多时候,数据分析并没有数据可供明确参考。
比如新进入一个市场或公司需要新开发摸个产品,需要预测一年后的销量。
这种时候有效数据缺失,选择先做出假设,再在假设的前提下进行分析。
- 核心:启发思考驱动的思维
- 优点:没有直观数据或线索能分析时,以假设先行的方式进行推断,是一个论证的过程
- 须知:不仅可以假设前提,也可以假设概率/比例,一切都可以假设,只要能够自圆其说
- 应用:它更多的是一种思考方式,假设-验证-判断
4. 指数法
很多时候我们有数据但不知道该如何应用,就是因为缺乏有效的方向。
这个方向可以成为目标指数:通过将数据加工成指数,达到聚焦的目的。
- 核心:目标驱动的思维
- 优点:目标驱动力强,直观简洁有效,对业务有一定的指导作用。一旦设立指数,不易频繁变动
- 须知:指数法没有统一的标准,很多指数依赖于经验的加工
- 应用:将无法利用的数据加工为可利用的数据。(同假设法进行区分,假设法是缺乏有效的数据)
1) 线性加权
2) 反比例
3) log对数
5. 二八法
二八法基于二八法则(帕累托法则)。
- 核心:只抓重点的思维
- 优点:和业务/KPI紧密相关,性价比优
- 须知:在条件允许的情况下,依旧不能放弃全局,否则会让思路变得狭隘
- 应用:存在于几乎所有领域
- 数据中,20%的变量直接产生80%的效果。数据分析更应该围绕这20%作文章
- 持续关注TopN的数据是一个非常好的习惯
- 虽然指标很多,但往往某些指标更有价值。二八法则不仅能分析数据,也能管理数据
6. 对比法
好的数据指标,一定是比例或比率。
好的数据分析,一定会用到对比。
对比法需要将当前数据同相应数据进行对比,数据才有相应的参考价值。
- 核心:挖掘数据规律的思考方式
- 优点:可以发现很多数据间的规律,它可以于任何思维技巧结合,比如多维对比、象限对比、假设对比
- 须知:在条件允许的情况下,依旧不能放弃全局,否则会让思路变得狭隘
- 应用:对比法更多是一种习惯,是数据分析的牛角尖。一次合格的分析一定要用到n次对比
7. 漏斗法
- 核心:一种流程化思考方式
- 优点:单一的漏斗分析没有用,需要和其他分析思维结合,如多维/对比法
- 须知:单一的漏斗分析没有用
- 应用:涉及到变化和流程的分析
在业务时间锻炼数据分析思维
好奇心,多思考
1. 用数据说话,运用思维方法思考问题
2. 换位思考,复盘分析
原文地址:https://www.cnblogs.com/xingyucn/p/10398517.html