先做《统计学学习指导书》
总结经验:统计学第六版可以分为三部分。第一部分是1到3章介绍了统计学两个分类之类描述统计数据,而5678章讲述了推断统计,其余张节介绍了数据统计的总和应用的一些方法,如单双因素法,等。。。到时候详述
关于1-4节主要讲述的内容:首先介绍了什么是统计学,统计学主要分为两部分描述统计和推断统计,介绍了数据的类型分类数据、顺序数据、数值数据、界面数据,时序数据,观测数据,实验数据等;此外介绍了一下相关量,变量,总体,样本,参数,统计量等与统计学息息相关的名词
然后讲述了统计学总要的数据如何搜集,首先要抽样确定样本单元,具体的抽样有概率抽样和非概率抽样两类,通过简单抽样,分层抽样等一系列抽样方式后,进行数据搜集。数据搜集也有许多不同的方式,注意数据搜集过程的误差合理控制非抽样误差,和抽样误差提高搜集数据的精确度
数据搜集到了需要进行数据的处理加工,先进行预处理找出不符和要求的数据,然后对数据进行筛选排序,做个透视图看看数据的整体状况。然后对数据进行品质分析作图,实现数据的可视化处理。对不同类型的数据使用不同的数据视图进行表示,分类数据,顺序数据,数值数据依次提高了数据的层次,高层次的数据表示不适用底层次的。具体分类数据可以用条形图,帕累托图,饼图,环状图来表示,属性数据是累积频数分布图表示,数值数值可以用直方图,茎叶图,箱线图表示。直方图更直观适用与大批量数据,茎叶图适用于小批量数据,雷达图,气泡图散点图适用与多变量分析
对数据进行了可视化处理能宏观总体把握数据的状态分布,但我们更需要详细的参数来具体刻画出数据的状态,这时就可以用数据的概括性度量对数据进行描述。描述主要的三个方面:数据的集中程度,数据的离散程度,数据的形状偏度和峰度。集中度方面对于分类数据使用众数对数据进行描述,顺序数据可以用中位数,分位数,四分位数进行描述统计,数值类型的数据可以使用平均数进行描述,注意数据类型的层次依次递增所有低层次的描述方式都适用于高层次的奥。在离散程度方面,我们使用异众比来描述分类数据,有四分位差描述顺序数据,用极值,方差,经验值,切比雪夫不等式来描述数据的离散波动情况,对于不同对象的离散数据描述使用离散系数进行描述。对于偏度分析0表示对称,大于1小于负1表示中度偏锋,越接近0越好,对于峰度是相对正态分布而言的,大于0尖峰,小于0扁平分布。
对象统计描述这部分是对数据进行预处理的关键,实现对数据的一个可视化的处理和总体描述,为以后的数据规律的观察,关系的拟合,假设检验奠定了基础,数据的统计描述是数据处理的关键一步,可以使用python,matlab,excel、spass(本人大体会这些)等软件进行一下处理。
原文地址:https://www.cnblogs.com/dugudongfangshuo/p/9169447.html