统计学只是扫盲

一、平均值

①算术平均数,也叫均值,分为简单算术平均数、加权算术平均数。它主要适用于数值型数据,不适用于品质数据。

    算术平均数是加权平均数的一种特殊形式(特殊在各项的权重相等)。在实际问题中,当各项权重不相等时,计算平均数时就要采用加权平均数;当各项权相等时,计算平均数就要采用算术平均数。

②加权平均值,即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。

  平均值的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。

  权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。  权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价。  打个比方说, 一件事情, 你给它打100分, 你的老板给它打60分, 如果平均, 则是(100+60)/2=80分. 但因为老板说的话分量比你重, 假如老板的权重是2, 你是1, 这时求平均值就是加权平均了, 结果是(100*1 + 60*2)/(1+2)=73.3分, 显然向你的老板那里倾斜了。假如老板权重是3,你的权重是1,结果是(100*1+60*3)/(1+3)=70。这就是根据权重的不同进行的平均数的计算,所以又叫加权平均数。

二、方差

①总体方差是一组资料中各数值与其算术平均数离差平方和的平均数。

②总体标准差则是总体方差的平方根。
   总体标准差是反映研究总体内个体之间差异程度的一种统计指标,用σ表示。

 标准差是最常用和最重要的变异性测量。标准差以分布的平均数作为参照点,用考虑每个数据和平均 数之间的距离来测量变异性。它由数据是否接近或远离平均数来决定。也就是说,它考虑数据是聚集还是离散的,简单来说,标准差与数据到平均数的平均距离近似。

三、期望值

  期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值

四、正态分布

五、t检验

  t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。

时间: 2024-10-05 09:58:25

统计学只是扫盲的相关文章

统计学的经典书籍指南 (转载自:http://blog.csdn.net/ysuncn/article/details/1943679)

一.统计学基础部分 1.<统计学> David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多.整本书几乎没有公式,但是讲到了统计思想的精髓. 2.<Mind on statistics(英文版)> 机械工业出版社 只需要高中的数学水平,统计的扫盲书.有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a

【程序员眼中的统计学(7)】正态分布的运用:正态之美

正态分布的运用:正态之美 作者 白宁超 2015年10月15日18:30:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于统

win7扫盲篇--介绍安装(1)

1.硬件+操作系统+软件应用=用户电脑 2.win7  2007年 winXP 2001年  不能兼容64位 win98 1998年 UNIX  银行操作系统 Linux开源自由的操作系统,安全稳定比较出色,在服务领域使用广泛,安卓是基于Linux操作系统 Mac OS苹果操作系统 MS-DOS 命令行操作 3.win7版本 win7家庭普通版的功能最少,简装版本 win7旗舰版,功能最多 硬件需求 cpu1GH以上,内存1G以上,硬盘16G以上,32位最多支持3个G得内存 cpu1GH以上,内

什么是敏捷开发?(扫盲)

敏捷开发的4句宣言 个体与交互 胜过 过程与工具 可以工作的软件 胜过 面面俱到的文挡 客户协作 胜过 合同谈判 响应变化 胜过 遵循计划 最近一直听人说"敏捷开发",一脸懵逼,根本不知道什么是敏捷开发,然后百度了一下,上面四句是比较普遍的总结! 什么是敏捷开发? 敏捷开发(Agile Development)是一种以人为核心.迭代.循序渐进的开发方法. 怎么理解呢?首先,我们要理解它不是一门技术,它是一种开发方法,也就是一种软件开发的流程,它会指导我们用规定的环节去一步一步完成项目的

不惧面试:HTTP协议(1) - 基础扫盲

v博客前言 先交代下背景,之前在一家公司面试.NET开发,去了先是做一份笔试题,有一半是关于HTTP协议的,技术总监直接面试,也是问一大堆HTTP协议的知识点,可能跟该公司的产品有关,该公司属于互联网公司,所以对HTTP协议比较看重吧.本人主要是做c/s开发,HTTP协议也只是略懂一二,所以面试的效果不太好,给的offer工资不高.面试回来后好好补了下HTTP协议.写这个系列的原因是总结自己遇到的面试题以及可能遇到的题目,更重要的是,今年定的目标是掌握网络这一块的知识点,先是搞懂HTTP协议,然

扫盲贴000---关于python中的if __name__ == &#39;__main__&#39;

对于python中的__name__变量,根据调用python文件的方式不同,__name__变量的值也会不同.假如我有一个名为hello_world.py的python脚本,当我的目的是直接运行这个文件"python hello_world.py"的时候,这个时候对于hello_world.py的__name__变量的值为"__main__".但是当我们把hello_world.py作为一个模块被另一个模块引入的时候"import hello_world

【程序员眼中的统计学(9)】总体和样本的估计:进行预测

总体和样本的估计:进行预测 作者 白宁超 2015年10月15日18:30:07 摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理.首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集.诚然在传统学科中,其在以上学科发挥作用很大.然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要.本系列统计学的学习基于<深入浅出统计学>一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习).正如(吴军)先生在<数学之美>一书中阐述的,基于

【数据分析/挖掘必备知识】统计学之卡方分布

统计学之卡方分布 作者 白宁超 2015年8月9日22:33:00 摘要:本文针对统计学之卡方分布的学习总结.本文首先介绍什么是卡方分布,以及卡方分布到底有何用处.然后根据其主要作用和特点进行剖析.采用题引方式进入卡方介绍,为了对概念深刻理解,则采用问题解决方式,遇到问题,首先介绍其概念以及实际使用的场景.主线采用卡方的两个主要用途检验拟合优度与检验两个变量的独立性,如果第一次听到此概念,也不用担心随后展开介绍.最后根据概念适应作以总结.再次基础上对核心内容进行扩展并对必要部分进行代码实现或者实

排序和顺序统计学(1)

也有好几天没记录算法学习情况了,这两天看了<算法导论>的第二部分,排序和顺序统计学,记录一下,也顺便增强记忆 1.堆排序 就是最大堆和最小堆,用一维数组存储,数据结构是完全二叉树.主要过程分为构建最大/最小堆,插入操作,弹出最大值,取最大/最小值,改变堆中的权值. 构建堆就是从第一个非叶子节点开始,倒数到第一个节点,对于每个节点执行以下函数(最大堆为例): void heapify(int x){ int largest; if (x*2<=heapsize&&a[x]