谁说菜鸟不会数据分析-入门篇

第一章 数据分析那些事儿

 1.1 数据分析是“神马”

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是

为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。    帮助管理者进行判断和决策

探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于验证已有假设的真伪证明。

分析方法:对比分析法、平均分析法、交叉分析法等 高级:相关分析、因子分析、回归分析等。

作用:现状分析、原因分析、预测分析

 1.2 数据分析六步曲

明确分析目的和思路→数据收集→数据处理(数据清洗、数据转化、数据提取、数据计算等)→数据分析→数据展现→报告撰写等6步。

 1.3 数据分析的三大误区

1.分析目的不明确,为分析而分析

2.缺乏业务知识,分析结果偏离实际

3.一味追求使用高级分析方法,热衷研究模型

 1.4 数据分析师的职业发展

职业要求:懂业务、懂管理、懂分析、懂工具、懂设计

基本素质:态度严谨负责、好奇心强烈、逻辑思维清晰、擅长模仿学习、勇于创新

 1.5 几个常用指标和术语

1.平均数

1)算数平均数:将总体内各单位的数量差异抽象画,代表总体的一般水平,掩盖了总体内个单位的差异。

2)调和平均数

3)几何平均数

2.绝对数和相对数

绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标;也可以表现为在一定时间、地点条件下数量增减变化的绝对数。

相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。计算基本公式:相对数=比较数值(比数)/基础数值(基数).

3.百分比和百分点

百分点是指不同时期以百分数的形式表示的相对指标的变动幅度:如 45% 比28%提高了17个百分点。

4.频数和频率

5.比例和比率

6.倍数和番数 番数=2^n

7.同比和环比

第二章 结构为王-确定分析思路

 2.1 数据分析方法论

方法论:5W2H、4P、逻辑树等分析思路

工具:Excel、SPSS、SAS等

技术:交叉分析、相关分析、回归分析、聚类分析等

 2.2 常用的数据分析方法论

营销方面的理论模型:4P用户使用行为、STP理论、SWOT等

管理方面的理论模型:PEST5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。

      

   

  • PEST分析理论主要用于行业分析。
  • 4P分析理论主要用于公司整体经营情况分析。
  • 逻辑树分析理论可用于业务问题专题分析。
  • 用户行为理论的用途较单一,就是用于用户行为研究分析。
  • 5W2H分析理论的用途相对广泛,可用于用户行为分析、业务问题专题分析等。

第三章 无米难为巧妇-数据准备

 3.1 理解数据

字段与记录、数据类型(字符型、数值型)、数据表

 3.2 数据来源

文本、网页等

第四章 三心二意-数据处理

 4.1 何为数据处理

“三心二意”:信心、细心、平常心、诚意、合意(满足需求方的分析目的和需求)

 4.2 数据清洗

重复数据的处理:函数法Countif、高级筛选法、条件格式法、数据透视表法

缺失数据处理:定位输入(F5或Gtrl+G)、Ctrl+Enter快捷键(快速填充选中单元格)、查找(Ctrl+F)替换(Ctrl+H)

检查数据逻辑错误:利用IF函数检查错误、利用条件格式标记错误

 4.3 数据加工

数据抽取:字段分列(菜单法分列、函数法left/right)、字段合并(&、CONCATENATE)、字段匹配(Vlookup)

数据计算:简单计算(+-*/ 自动求和等)、函数计算(平均值和总和、日期的加减法、用函数datedif计算工龄)

数据分组:Vlookup(近似匹配,<=查找值的最大匹配值)

数据转换:数据表的行列转换等

 4.4 数据抽样

普查、抽样调查  rand函数

第五章 工欲善其事必先利其器-数据分析

 5.1 数据分析方法

1.对比分析法

1)定义:指将两个或两个以上的数据进行比较,分析他们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。

特点:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。

2)分类:静态比较实在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较,也叫横向比较,简称横比。

动态比较是在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。

3)实践运用:与目标对比、不同时期对比(同比/环比)、同级部门/单位/地区对比、行业内对比、活动效果对比等

2.分组分析法:等距分组、不等距分组  组距 组数

3.结构分析法  占比

结构分析法是指被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。

4.平均分析法

平均分析法就是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。

平均指标:算数平均数、调和平均数、几何平均数、众数、中位数等

5.交叉分析法

6.综合评价分析法

数据标准化:0-1标准化(离差标准化,就是对原始数据作线性变换,使结果落在[0,1]区间)、Z标准化

权重确定方法:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法等、目标优化矩阵

7.杜邦分析法  财务

8.漏斗图分析法  转化率、流失率

9.矩阵关联分析法 象限图分析法

10.高级数据分析方法

 5.2 数据分析工具

1.数据透视表

第六章 给数据量体裁衣-数据展现

6.1 解开图表的真面目

作用:表达形象化、突出重点、体现专业化

通过关系选择图表:

图表制作五步法:确定所要表达的主题和目的、确定哪种图表最适合你的目的、选择数据制作图表、检查是否真实有效地展示数据、检查是否表达了你的观点

 6.2 表格也疯狂

突出显示单元格、项目选取、数据条、图标集、迷你图

 6.3 给图表换装

平均线图、双坐标图、竖行折线图、瀑布图、帕累托图、旋风图、人口金字塔图、漏斗图、矩阵图(散点图)

时间: 2024-08-26 17:14:21

谁说菜鸟不会数据分析-入门篇的相关文章

谁说菜鸟不会数据分析

本文首先对数据分析做了一个总体的描述,然后介绍数据分析的基本步骤,各步骤使用的工具都是excel.入门系列,不足颇多,望诸君指点. 参考书籍: <谁说菜鸟不会数据分析>(人门篇+工具篇) <Excel图表拒绝平庸> 总体介绍 所有的分析都是这六步,明确分析目的和思路-收集数据-数据处理-数据分析-数据展现-撰写报告.技能树也是围绕这六部展开,数据处理方面为数据清洗和加工,数据分析为统计学和数据挖掘,数据展现为数据可视化,撰写报告为PPT,而这些步骤中都可以用excel.python

cocos2dx 3.1从零学习(一)——入门篇(一天学会打飞机)

我们有C++基础,学习引擎总是急于求成,想立马做出一款简单的游戏给朋友玩.但是我们往往看了很多资料却一直不知道如何下手去写,有时候只要能走出第一步我们就会游刃有余,但是眼高手低的我们不是大神,需要有人指引一下.这里我就写一下我是如何入门学习cocos2dx3.1的,给大家参考一下. 如果你想第一天就写出微信打飞机,请耐心去阅读.我也是一个菜鸟,博客难免粗糙和出错,请大家谅解.加油吧! 我们创建工程后总会自带一个HelloWorld类,短短的几行代码就出来了一个游戏的雏形,请问我们真的理解它了吗?

Python数据分析入门

Python数据分析入门 最近,Analysis with Programming加入了Planet Python.作为该网站的首批特约博客,我这里来分享一下如何通过Python来开始数据分析.具体内容如下: 数据导入 导入本地的或者web端的CSV文件: 数据变换: 数据统计描述: 假设检验 单样本t检验: 可视化: 创建自定义函数. 数据导入 这是很关键的一步,为了后续的分析我们首先需要导入数据.通常来说,数据是CSV格式,就算不是,至少也可以转换成CSV格式.在Python中,我们的操作如

SQL注入漏洞全接触--入门篇

随着B/S模式应用开发的发展,使用这种模式编写应用程序的程序员也越来越多.但是由于这个行业的入门门槛不高,程序员的水平及经验也参差不齐,相当大一部分程序员在编写代码的时候,没有对用户输入数据的合法性进行判断,使应用程序存在安全隐患.用户可以提交一段数据库查询代码,根据程序返回的结果,获得某些他想得知的数据,这就是所谓的SQL Injection,即SQL注入. SQL注入是从正常的WWW端口访问,而且表面看起来跟一般的Web页面访问没什么区别,所以目前市面的防火墙都不会对SQL注入发出警报,如果

Pandas系列之入门篇

Pandas系列之入门篇 简介 pandas 是 python用来数据清洗.分析的包,可以使用类sql的语法方便的进行数据关联.查询,属于内存计算范畴, 效率远远高于硬盘计算的数据库存储.另外pandas还提供了大数据存储的API--HDFStore,来对接HDF5. 安装 pandas 利用豆瓣源,速度快 pip install pandas numpy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pytabl

《Java从入门到放弃》入门篇:springMVC数据校验

昨天我们扯完了数据传递,今天我们来聊聊数据校验的问题.来,跟着我一起读:计一噢叫,一按艳. 在springMVC中校验数据也非常简单,spring3.0拥有自己独立的数据校验框架,同时支持JSR303标准的校验框架. Spring的DataBinder在进行数据绑定时,会同时调用校验框架完成数据校验工作. 具体使用步骤如下: 1)导入数据校验的JAR包 2)在springmvc的配置文件中添加校验Bean 3)修改实体类,在属性上加上校验的注解 4)修改昨天的login4方法,加上校验的相关代码

Vue学习笔记入门篇——组件的使用

本文为转载,原文:Vue学习笔记入门篇--组件的使用 组件定义 组件 (Component) 是 Vue.js 最强大的功能之一.组件可以扩展 HTML 元素,封装可重用的代码.在较高层面上,组件是自定义元素,Vue.js 的编译器为它添加特殊功能.在有些情况下,组件也可以是原生 HTML 元素的形式,以 is 特性扩展. 组件使用 注册 注册一个全局组件,你可以使用 Vue.component(tagName, options).组件在注册之后,便可以在父实例的模块中以自定义元素 的形式使用.

Vue学习笔记入门篇——组件的内容分发(slot)

本文为转载,原文:Vue学习笔记入门篇--组件的内容分发(slot) 介绍 为了让组件可以组合,我们需要一种方式来混合父组件的内容与子组件自己的模板.这个过程被称为 内容分发 (或 "transclusion" 如果你熟悉 Angular).Vue.js 实现了一个内容分发 API,使用特殊的 'slot' 元素作为原始内容的插槽. 编译作用域 在深入内容分发 API 之前,我们先明确内容在哪个作用域里编译.假定模板为: <child-component> {{ messa

漫游Kafka入门篇之简单介绍

原文地址:http://blog.csdn.net/honglei915/article/details/37564521 介绍 Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了普通消息系统的功能,但具有自己独特的设计.这个独特的设计是什么样的呢? 首先让我们看几个基本的消息系统术语: Kafka将消息以topic为单位进行归纳. 将向Kafka topic发布消息的程序成为producers. 将预订topics并消费消息的程序成为consumer. Kafka以集群的方式运行,