从零进阶!数据分析的统计基础

第 1 章
数据分析概述 1
1.1 什么是数据分析 . 2
1.2 数据分析六步曲 . 2
1.2.1 明确分析目的和内容 . 2
1.2.2 数据收集. 3
1.2.3 数据预处理. 3
1.2.4 数据分析. 3
1.2.5 数据展现. 4
1.2.6 报告撰写. 5
1.3 数据分析方法简介 . 5
1.3.1 统计分析方法简介 . 5
1.3.2 数据挖掘方法简介 . 6
1.3.3 统计分析与数据挖掘的区别和联系 . 9
1.4 常用数据分析工具的安装 . 10
1.4.1 在 Excel 2013 中安装数据分析工具 . 10
1.4.2 数据分析软件 SPSS 的安装 13
1.5 课后练习 . 18
第 2 章
描述性统计分析 19
2.1 直方图 . 20
2.1.1 什么是直方图. 20
2.1.2 如何看直方图. 20
2.1.3 如何画直方图. 20
2.1.4 使用 Excel 2013 进行直方图的绘制 . 22
2.2 数据的计量尺度 . 24
2.3 数据的集中趋势 . 25
2.3.1 定量数据:平均数 . 25
2.3.2 顺序数据:中位数和分位数 . 27
2.3.3 分类数据:众数. 27
2.4 数据的离中趋势 . 28
2.4.1 极差 28
2.4.2 分位距 29
2.4.3 平均差 29
2.4.4 方差与标准差 30
2.4.5 离散系数 32
2.5 数据分布的测度 . 33
2.5.1 数据偏态及其测定. 34
2.5.2 数据峰度及其测定. 34
2.5.3 数据偏度和峰度的作用. 35
2.6 数据的展示--统计图 . 35
2.6.1 条形图与扇形图. 36
2.6.2 折线图 36
2.6.3 茎叶图 37
2.6.4 箱线图 40
2.6.5 统计图小结 42
2.7 使用 Excel 实现数据的描述性统计及分析 43
2.7.1 使用 Excel 实现三国全部武将武力描述性统计 43
2.7.2 使用 Excel 分别实现三个国家武将武力描述性统计分析 44
2.8 课后习题. 45
第 3 章
抽样估计 . 48
3.1 抽样估计基础 . 49
3.1.1 随机事件 49
3.1.2 随机事件的概率. 50
3.1.3 随机变量及其概率分布. 52
3.1.4 随机变量的数字特征. 55
3.2 正态分布及三大分布 . 56
3.2.1 正态分布的概率密度函数. 56
3.2.2 正态分布的特征. 57
3.2.3 标准正态分布 58
3.2.4 基于正态分布的三大分布. 61
3.3 中心极限定理 . 63
3.3.1 中心极限定理的提法. 63
3.3.2 中心极限定理的内容. 64
3.3.3 中心极限定理的意义与应用 . 64
3.4 抽样估计 . 65
3.4.1 抽样估计概述. 66
3.4.2 抽样估计的基本概念 . 66
3.4.3 抽样估计的误差 . 70
3.4.4 抽样估计的理论基础 . 72
3.4.5 抽样估计的方法 . 73
3.4.6 抽样的组织形式 . 77
3.4.7 必要抽样数目的确定 . 78
3.5 课后习题 . 80
第 4 章
假设检验 86
4.1 假设检验概述 . 87
4.1.1 假设检验的概念 . 87
4.1.2 假设检验的基本思想 . 87
4.1.3 假设检验在数据分析中的作用 . 88
4.2 假设检验的分析方法 . 88
4.2.1 假设检验的基本步骤 . 88
4.2.2 假设检验与区间估计的联系 . 90
4.2.3 假设检验中的两类错误 . 92
4.2.4 利用 P 值进行决策 92
4.2.5 应用假设检验需要注意的问题 . 94
4.3 常见的检验统计量 . 94
4.3.1 z 检验统计量 95
4.3.2 t 检验统计量. 96
4.3.3 2 检验统计量. 97
4.3.4 F 检验统计量 . 97
4.3.5 各种检验统计量一览表 . 97
4.4 SPSS 中常用的几种 t 检验实例 99
4.4.1 单样本 t 检验 99
4.4.2 两独立样本 t 检验 102
4.4.3 配对样本 t 检验 106
4.5 课后习题 . 110
第 5 章
方差分析 114
5.1 方差分析 . 115
5.1.1 方差分析的概述 . 115
5.1.2 方差分析的几个概念 . 115
5.1.3 单因素方差分析中的基本假定 . 116
5.2 单因素方差分析 . 116
5.2.1 单因素方差分析的原理. 116
5.2.2 单因素方差分析的数据结构 . 117
5.2.3 单因素方差分析的统计量. 118
5.2.4 单因素方差分析的基本步骤 . 119
5.3 使用 SPSS 实现单因素方差分析的步骤及结果分析 . 119
5.3.1 操作步骤及必要说明. 119
5.3.2 对操作结果的分析. 123
5.4 课后习题. 126
第 6 章
相关与回归分析 130
6.1 变量间的关系 . 131
6.1.1 函数关系及特点. 131
6.1.2 相关关系及特点. 131
6.2 相关分析. 132
6.2.1 相关分析及步骤. 132
6.2.2 散点图的绘制 132
6.2.3 相关系数 133
6.2.4 相关系数的显著性检验. 134
6.2.5 使用 SPSS 实现相关分析 135
6.3 一元线性回归分析 . 137
6.3.1 一元回归模型及相关假定. 138
6.3.2 一元线性回归方程及求法. 138
6.3.3 回归直线的拟合优度. 139
6.3.4 回归模型的检验. 139
6.4 使用 SPSS 实现一元线性回归分析 141
6.4.1 画散点图和趋势线. 142
6.4.2 简单相关分析 145
6.4.3 一元线性回归分析的操作步骤 . 145
6.4.4 一元线性回归分析的结果解读 . 150
6.5 课后习题. 153
附录 A 三国武将数据 . 160
附录 B
CDA(注册数据分析师)致力于最好的数据分析人才建设 . 175

时间: 2024-10-10 13:15:29

从零进阶!数据分析的统计基础的相关文章

下载零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析,挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺省值,

零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习 之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如 此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺

数据分析的统计基础5

样本均值.样本比例和样本方差的抽样分布 样本均值的抽样分布 在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布 一种理论概率分布 推断总体均值\(\mu\)的理论基础 大数定律表明:当来自于独立同分布(i.i.d)的总体(该总体均值为\(\mu\),方差为\(\sigma^2\))中\(n\)个随机变量\(X_1,X_2,...X_n\),其均值\(\bar X = n^{-1}\sum \limits_{i=1}^{n}X_i\),随着\(n \to \infty\),有\

(原创)记录书籍和教程

书籍(纸质书和pdf文档): 已经看过 数学之美 统计学习方法 python基础教程 人工智能 神经网络与深度学习 深度学习 problem solving with algorithms and data sturctures using python 还没有看完的书籍 tensorflow机器学习实战指南 数据结构(python语言实现) 从零进阶 数据分析的统计基础 机器学习实战(一半) 算法设计与分析基础 想看的书籍 深入浅出统计学 利用python进行数据分析 剑指offer 程序员面

第九届CDA考试状元访谈,看看状元们都说了啥

第九届CDA数据分析师认证考试在2018年12月底圆满地落下了帷幕. 成绩已经揭晓(https://www.cda.cn/bigdata/26446.html),崭新的证书大抵都抵达每位通过考试的持证人手中啦! 近日,我们采访了在本届考试中名列前茅的几位优秀学员,并在本文中整理了他们的备考和学习经验,希望备考者们能够有所参考,并取得理想的成绩. 今天为大家带来的是CDA认证考试 Level 1 中成绩前六名的几位大神.其中四名并列状元,两位榜眼.下面让我们来一睹他们的风采吧! Level 1 状

数据分析师教程_从小白到“数据分析师”大神进阶之路

课程学习地址:http://www.xuetuwuyou.com/course/231课程出自学途无忧网:http://www.xuetuwuyou.com 课程特色--成长六部曲小白脱白篇->数据分析篇->数据挖掘篇-> Python加薪冲刺篇->大数据分析师进阶篇-->精英项目实战篇 一.课程目标数据分析师秉承着总结凝练最先进的商业数据分析实践为使命,明晰各类数据分析从业者的知识体系为职责.本课程就是为了这个目标而量身订做的.旨在加强全球范围内正规化.科学化.专业化的大数

office零基础——Excel篇

office办公软件是职场人士每天都要使用的一套工具,它包括了:PowerPoint.word.Excel三大办公神器. 大多数人对Word和PowerPoint(PPT)了解比较多,Word是文字编辑,PPT是演示文稿:Excel?不就是做表格的吗?这玩意还要学?很多人对Excel的认识存在误区,认为它只是一种表格制作工具,而往往无视了它强大的数据处理和分析能力.等我们面临着一大堆要处理的数据时,心力交瘁的我们无不内心狂呼:"为什么我没有好好学习Excel?!" 想要学好Excel,

CDA数据分析师协会等级认证证书

CDA数据分析师协会等级认证证书 (Certified Data Analyst  Certificate) CDA数据分析师证书由CDA数据分析师协会官方颁发,此证书在国内需通过人大经济论坛举办的CDA等级认证考试后获得.此证书可作为企业事业单位选拔和聘用专业人才的任职参考依据.  一.考试简介: CDA(Certified Data Analyst),全称"注册数据分析师",由"CDA注册数据分析师协会(Certified Data Analyst Institute)&

合格大数据分析师应该具备的技能

阶段一.业务数据分析师 课程一.数据挖掘/分析师之硬技能 - 必备常用工具使用与高级技巧 本部分内容主要介绍了数据挖掘.分析师.数据产品经理必备的常用工具的,主要有 Excel,Visio,Xmind,PPT的涉及图表数据分析方面的高级技巧,包括但不限于:数据透视表演练.Vision跨职能流程图演练.Xmind项目计划导图演练.PPT高级动画技巧等! 一.Excel 1)数据分析工具EXECL入门介绍2)数据透视表演练 3) 数据处理4) EXECL报告自动化5) PPT报告数据自动化 二.Vi