统计学 一 集中趋势

预览

参考书籍:浙大概率论与数理统计, 俄罗斯的概率教材, 概率-施利亚耶夫著作, 统计学及应用-sarah boslaugh著作????

统计学分类:

????描述统计学:展示数据, 描述数据的集中和离散程度

????推断统计学:根据样本数据推断总体的数据特征

统计趋势:

????集中趋势, 离散趋势

统计学应用:

????有数据, 就有统计分析的需求

把握要点:

概率论是统计学实施的基础, 统计学倾向于解决实际问题

????常用符号:

????????μ: 总体均值

????????σ:总体标准差

????????s:样本方差

????????Σ:求和

?

总体和样本:

????同一个数据集合既可以是总体也可以是样本, 具体取决于对该数据集合的分析目标

????分析目标是数据集的数据分布, 则该数据集是总体

????分析目标是通过该数据集,推断其他同类数据的趋势,则该数据集为样本

????例如:

????????一个数据集为某个班学生的期末成绩

????????分析目标是描述成绩分布的时候, 那么该班的期末成绩为总体

????????分析目标是通过该班的成绩推断其他学生的期末成绩的时候, 那么该班的期末成绩为样本

????

?

集中趋势描述度量:

数据向中心值靠拢的程度,反映的是数据中心点的位置

反映集中趋势的测度的统计量: 均值, 中位数, 众数

?

????均值:

算术平均数, 所有统计数据的平均值, 描述平均水平

?

????????均值对较小或者较大的异常值包容性较小, 容易受极端值的影响, 均值并不适合极端值多的数据集

????????对于偏态数据集(非对称数据) 均值结果会产生误导, 不能准确反映大多数数据的趋势, 则改用中位数取代

????????极端值: 也叫离群点,

?

????分组数据均值:

????????分组区间中点X分组频数

?

????中位数:

数据按照大小的排列顺序,

位于排序后的数据后的中间的数据

????排序后的个数为偶数时: 中位数是中间两个数值的平均值

????排序后的个数为奇数时: 中位数是就是中间的数值

?

太过于分散的数据集, 中位数也不能很好 的描述数据的集中趋势, 缺少敏感性

?

众数:

数据集中出现频数最多的数值, 众数不唯一

?

当数据具有明显的集中趋势的时候, 代表性较好, 不受极端值的影响

?

离散趋势描述度量:

????描述数据分散程度的度量, 也会被称为, 波动测度或者分布测度

????反映离散程度的度量: 极差, 四分位差, 方差, 标准差

????

????极差:

????????数据中最大值最小值之差

????????简单描述数据的范围大小

?

????

????

?

????

原文地址:https://www.cnblogs.com/binyang/p/10915436.html

时间: 2024-10-05 07:22:02

统计学 一 集中趋势的相关文章

【程序员眼中的统计学(7)】正态分布的运用:正态之美

正态分布的运用:正态之美 作者 白宁超 2015年10月15日18:30:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于统

【程序员眼中的统计学(9)】总体和样本的估计:进行预测

总体和样本的估计:进行预测 作者 白宁超 2015年10月15日18:30:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于

【程序员眼中的统计学(12)】相关与回归:我的线条如何? (转)

阅读目录 目录 1 算法的基本描述 2 算法的应用场景. 3算法的优点和缺点 4 算法的输入数据.中间结果以及输出结果 5 算法的代码参考 6 共享 相关与回归:我的线条如何? 作者 白宁超 2015年10月25日22:16:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习

统计学基础(1)

统计学: 统计学可以分为:描述统计学和推断统计学 描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度.例:每次考试算的平均分.最高分.各个分段的人数分布等,也是属于描述统计学的范围. 推断统计学:根据样本数据推断总体数据特征.例:产品质量检查,一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个估计. 集中趋势: 对于一组数据,如果只容许使用一个数字去代表这组数据,那么选择数据的中心,即反映数据集中趋势的统计量. 均值:算数平均数,描述平均水平. 中位数:将数据按大小排列

【程序员眼中的统计学(5)】排列组合:排序、排位、排

排列组合:排序.排位.排 作者 白宁超 2015年10月15日18:30:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于统

程序员眼中的统计学(3)】概率计算:把握机会

概率计算:把握机会 作者 白宁超 2015年10月13日23:23:13 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于统计和数

统计学如何用少量数据概括数据(相关概念)

用少量数据来概括大量数字是日常生活中常见的.那么可以用少量所谓汇总统计量或概括统计量(summary statistic)来描述定量变量的数据.任何样本的函数,只要不包含总体的未知参数,都称为统计量(statistic),那么样本的随机性决定了统计量的随机性. 数据的"位置" 比如说哪个地方穷,那个地方富,哪个国家人高,哪个国家人矮,这样不是说一个地方的所有人都比另一个地方的所有人富有或高,仅仅忽略了"平均起来"这样的字眼.实际上,这种说法是关于数据中某变量观测值的

统计学基础

统计学基础 统计 本文主要是对公开课<简单统计学>及书本<商务与经济统计>的学习笔记及练习. 一.统计基本概念 统计基本范围 统计工作流程 随机变量的种类 二.常用统计量及统计图表 连续型数据特征值的计算 集中趋势的度量 平均数.中位数.众数: 分散趋势的度量 全距.方差(变异数).标准差: 分布形态的度量 偏度.峰度: 相关关系的度量 协方差.相关系数: 下面是一些用来表示样本统计量和总体参数的符号, 连续型数据特征值的应用 经验法则(切比雪夫定理的应用) 五数概括法(five-

统计学-单变量描述性统计

复习一遍统计学基础,准备spss的考试. 拿到一组陌生的数据,就像遇见一个陌生人,我们遇到一个陌生人,第一件事往往就是打量打量ta,处理数据也是如此.描述性统计就是在打量一组数据,对数据有个大概对了解.一般来说,对数据做三个处理:集中趋势central tendency,离散趋势dispersion tendency,分布形态distribution tendency.虽然简单,但是最为基础,是我们后续数据分析的前提,通过对数据的描述性统计,我们才能选择合适的统计方法,以防误用. 单变量统计分析