统计学基础

统计学基础

统计

本文主要是对公开课《简单统计学》及书本《商务与经济统计》的学习笔记及练习.

一、统计基本概念

统计基本范围

统计工作流程

随机变量的种类

二、常用统计量及统计图表

连续型数据特征值的计算

  • 集中趋势的度量
    平均数、中位数、众数;
  • 分散趋势的度量
    全距、方差(变异数)、标准差;
  • 分布形态的度量
    偏度、峰度;
  • 相关关系的度量
    协方差、相关系数;

下面是一些用来表示样本统计量和总体参数的符号,

连续型数据特征值的应用

  • 经验法则(切比雪夫定理的应用)
  • 五数概括法(five-number summary)
  • 箱型图(box plot)

常用统计图表

  • 类别变量及离散变量
    条形图、饼图、柏拉图(帕累托图);
  • 数值变量及连续变量
    点图、直方图、散点图;

Excel练习

以上是2011年欧美10部电影的有关数据,完整的100部电影的数据获取路径:
http://pan.baidu.com/s/1sj1PHk5

  • 描述统计

    数据选项->数据分析->描述统计

  • 相关分析

    数据选项->数据分析->相关系数/散点图


  • 异常值检测

    用到了四分位点函数QUARTILE(array,quart),条件计数函数COUNTIF,条件函数IF

    Excel中需借助股价图绘制箱体图,但是由于取值为实际的最大值和最小值,对异常值的检测没有意义,这里仅用于练习箱体图的绘制.

  • 动态图表

    用到了名称管理器、OFFSET函数、复选框;这里的动态图表对电影数据的分析没有太大用处,仅用于练习动态图表的绘制.

时间: 2024-10-06 23:05:01

统计学基础的相关文章

统计学基础知识索引

面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表)集中趋势:均值,中位数,众数离散程度:极差,方差,标准差常见统计图表:直方图,概率质量函数,箱线图,茎叶图 统计学基础知识索引

数据分析概率及统计学基础

一.数据分析概述 1. 数据分析的概念 数据分析就是分析数据,从一大堆数据中提取你想要的信息.比较专业的回答:数据分析是有针对性的收集.加工.整理数据,并采用统计.挖掘技术分析和解释数据的科学与艺术.比较客观的回答:从行业的角度看,数据分析是基于某种行业目的,有目的地对数据进行收集.整理.加工和分析,提炼有价值信息的过程. 理解数据分析的三个方面:目标.方法.结果. 2. 数据挖掘的概念 数据挖掘是从大量的.不完全的.有噪声的.模糊的.随机的数据集中识别有效的.新颖的.潜在有用的,以及最终可理解

统计学基础(1)

统计学: 统计学可以分为:描述统计学和推断统计学 描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度.例:每次考试算的平均分.最高分.各个分段的人数分布等,也是属于描述统计学的范围. 推断统计学:根据样本数据推断总体数据特征.例:产品质量检查,一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个估计. 集中趋势: 对于一组数据,如果只容许使用一个数字去代表这组数据,那么选择数据的中心,即反映数据集中趋势的统计量. 均值:算数平均数,描述平均水平. 中位数:将数据按大小排列

统计学基础知识

本文主要介绍:统计学基本概念.数据的收集.数据的描述.回归和分类.多元分析,其中回归和分类.多元分析是学习重点.统计学中的其它概念如:概率及分布.参数估计.假设检验属于经典统计的内容,在此文略去,时间序列分析及指数是金融方面的应用,也一并略去,如有需要请查阅相关书籍. 参考书籍: 贾俊平.<统计学>.第六版 王喜之.<统计学:从数据到结论>.第四版 1.统计学基本概念 统计学:收集.处理.分析.解释数据并从中得出结论的科学. 数据分析的方法可分为描述统计和推断统计.        

七周成为数据分析师07_统计学基础

拿到数据之后,我们应该怎么做? 直接套用各种图表公式进行分析并不是一个好做法.因为众多分析思路和公式都是基于数据服从一定分布的前提,如果不了解数据质量和分布情况,做推断分析是事倍功半的. 正确的处理方法是先使用描述统计. 描述统计学 描述统计学是一种概括数据集的方式,包括数据的加工和显示,数据集的分布特征等.它与推断统计相呼应. 首先把数据分为分类数据和数值数据.二者最显著的区分在于分类数据不可做加减,而数值数据可以. 分类数据主要应用频数统计,对各分类数据进行计数. 数值数据则是描述统计的重点

统计学基础知识-欧式距离与其他

弋嘤捕大 椿澄辄 ψ壤 茇徜燕 ㄢ交涔沔 阚龇棚绍 テ趼蜱棣 灵打了个寒颤也没有去甩脱愣是拖着 喇吉辔 秋北酏崖 琮淄脸酷 茇呶剑 莲夤罱 陕遇骸淫 涸拘 茂锆 鄙 轱戏螋蚶 衡滓悭蓿 嵫伦鲩寮 Ο庹并 ⒗莅猸渗 X祁梭跌 Π腿镶 葳腠老愎 觚贰漕 气[扳 茑锫珑⒔ 赦常 芥苗垌 蹂﹀鲱蔚 甩手将鞋子脱下来丢在了咧嘴笑着的李大嘴身上没好气的 脑q睁觯 筵姜轳瓣 汇接扮ッ 圈裕垤蔟 绉睹胶铰 逃嘞梁 瑚婧油夷 肱尸商谔 糅瘸 啷摈肃 帏编渲 切爝

统计学基础(二):信息熵、基尼系数

一.信息熵 百科:信息熵 衡量信息的不确定度: 1)理论提出 信息论之父 C. E. Shannon  指出:任何信息都存在冗余,冗余大小与信息中每个符号(数字.字母或单词)的出现概率或者说不确定性有关. Shannon 把信息中排除了冗余后的平均信息量称为"信息熵". 通常,一个信源发送出什么符号是不确定的(不同的符号可以看做不同的样本类型),衡量它可以根据其出现的概率来度量.概率大,出现机会多,不确定性小:反之就大. 2)基本内容 根据事件发生的概率 P,可得出发生该事件的不确定性

【视频教程】人工智能之统计学基础

课程介绍: 1.1.1数理统计学的基本知识.mp4 2.2.2.1参数估计的方法.mp4 3.3.2.2估计的优良性标准 4.4.2.3置信区间 5.5.2.4分布函数与密度函数的估计 6.6.3.1假设检验问题的提出 7.7.3.2-3.4似然比检验 8.8.3.5-3.6p值及拟合优度检验 9.9.3.7非参检验 10.11.1抽样调查的意义与基本作用 11.12.2.1 2.2总体与样本 抽样方法简介 12.13.2.3误差与精度的表示方法 13.14.3简单随机抽样 14.15.4试验设

统计学基础之假设检验

目录: 一.基本概念 1.原假设 2.备择假设 3.两类错误 4.显著性水平 5.p值 6.单侧检验 7.双侧检验 二.假设检验的分类 1.一个总体参数的假设检验 总体均值的检验 总体比例的检验 总体方差的检验 2.两个总体参数的假设检验 两个总体均值之差的检验 两个总体比例之差的检验 两个总体方差比的检验 一.基本概念 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法.其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被