统计学基础
统计
本文主要是对公开课《简单统计学》及书本《商务与经济统计》的学习笔记及练习.
一、统计基本概念
统计基本范围
统计工作流程
随机变量的种类
二、常用统计量及统计图表
连续型数据特征值的计算
- 集中趋势的度量
平均数、中位数、众数; - 分散趋势的度量
全距、方差(变异数)、标准差; - 分布形态的度量
偏度、峰度; - 相关关系的度量
协方差、相关系数;
下面是一些用来表示样本统计量和总体参数的符号,
连续型数据特征值的应用
- 经验法则(切比雪夫定理的应用)
- 五数概括法(five-number summary)
- 箱型图(box plot)
常用统计图表
- 类别变量及离散变量
条形图、饼图、柏拉图(帕累托图); - 数值变量及连续变量
点图、直方图、散点图;
Excel练习
以上是2011年欧美10部电影的有关数据,完整的100部电影的数据获取路径:
http://pan.baidu.com/s/1sj1PHk5
- 描述统计
数据选项->数据分析->描述统计
- 相关分析
数据选项->数据分析->相关系数/散点图
- 异常值检测
用到了四分位点函数QUARTILE(array,quart),条件计数函数COUNTIF,条件函数IF
Excel中需借助股价图绘制箱体图,但是由于取值为实际的最大值和最小值,对异常值的检测没有意义,这里仅用于练习箱体图的绘制.
- 动态图表
用到了名称管理器、OFFSET函数、复选框;这里的动态图表对电影数据的分析没有太大用处,仅用于练习动态图表的绘制.
时间: 2024-10-06 23:05:01