概率统计

概率统计

欢迎关注我的博客:http://blog.csdn.NET/hit2015spring

条件概率

是任意两个事件,且,则称为事件在事件发生的条件下发生的条件概率。记作:

\begin{equation}
P(A|B)=\frac{P(AB)}{P(B)}
\end{equation}

这里可以理解是,在事件发生的情况里面去寻找事件也在的例子,就是条件概率,有一种归一化的感觉,也有一种找出全局,再去挑局部的概念。

引入一个定理:

(两个事件的积的概率)=(其中一个事件的概率)(另一个事件在前面一个事件发生条件下的条件概率)即:

\begin{equation}
P(AB)=P(A|B)P(B)=P(B|A)P(A)
\end{equation}

推广:

\begin{equation}
P(A_1A_2 \cdots A_n)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)P(A_4|A_1A_2A_3)\cdots P(A_n|A_1A_2A_3\cdots,A_n)
\end{equation}

例子:

例题

解答

全概率公式

全概率公式定义

enter description here

贝叶斯公式

\begin{equation}
P(A_i|B)=\frac{P(A_iB)}{P(B)}=\frac{P(B|A_i)P(A_i)}{P(B)}=\frac{P(B|A_i)P(A_i)}{\sum\limits_{i=1}^{n}P(B|A_i)P(A_i)}
\end{equation}

其中用一个条件概率的公式

\begin{equation}
P(B|A_i)=\frac{P(A_iB)}{P(A_i)}
\end{equation}

是先验概率,一般是经验的总结。是后验概率,表示实验之后各种原因发生的可能性

重复独立实验、二项概率公式

一个实验里面有两个结果,,这个实验称为伯努利实验。它的重复n次的独立实验就叫做:n重伯努利实验。

设在每次实验中成功的概率是,则在重伯努利实验中,成功恰好发生次的概率是

\begin{equation}
P_n(k)=C_n^kp^k(1-p)^{n-k}
\end{equation}

例子:

l例题

当实验次数很大的时候的时候,公式可变为,这时为二项泊松分布

\begin{equation}
C_n^k p^k(1-p)^{n-k}\to \frac{\lambda^k}{k!}e^{-\lambda}
\end{equation}

数学期望和方差

几个结论

0-1分布 泊松分布 几何分布
期望
方差

enter description here

切比雪夫不等式

\begin{equation}
P[|X-E(X)| \geq \varepsilon ]\leq \frac{D(X)}{\varepsilon^2}
\end{equation}

一个随机变量偏移它中心的概率是与距离和它的方差有关的不等式

伯努利大数定律

重伯努利实验中,成功的次数为,而每次成功的概率为,则对任意的

\begin{equation}
\lim\limits_{n \to \infty} P(|\frac{Y_n}{n}-p|\geq \varepsilon)=0
\end{equation}

当实验次数足够大的时候,成功的频率与成功的概率之差的绝对值不小于任意一个指定的正数的概率可以小于任意一个预先指定的正数,这就是频率稳定性的一种确切的解释。根据伯努利大数定律在实际应用中,当实验次数很大时,可以用事件的频率来近似得代替事件的概率。

辛钦大数定律

设随机变量序列 是独立同分布的随机变量,具有有限的数学期望和方差则对任意的

\begin{equation}
\lim\limits_{n \to \infty} P(|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|\geq \varepsilon)=0
\end{equation}

是随机变量个观测值的算术平均值,而,当实验次数足够大的时候平均值与数学期望之差的绝对值不小于任一指定的正数的概率小于任意一个预先指定的正数,这就是算术平均值稳定性的解释

中心极限定理

被研究的随机变量是大量独立随机变量的和,其中每一个随机变量对于总和只起微小的作用,则可以认为这个随机变量近似服从于正态分布。

Lindeberg-levi 中心极限定理

如果随机变量序列独立同分布,并且具有有限的数学期望和方差则对一切的

\begin{equation}
\lim\limits_{n \to \infty} P(\frac{1}{\sqrt n \sigma}(\sum \limits_{i=1}^{m}X_i-n\mu)\geq 0)=\int _{- \infty}^{x} \frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt
\end{equation}

重伯努利实验中,成功的次数为而在每次实验中成功的概率是则对一切的

\begin{equation}
\lim\limits_{n \to \infty} P(\frac{Y_n-np}{\sqrt{npq}} \geq x)=\int _{- \infty}^{x} \frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt=\Phi(x)
\end{equation}

时间: 2024-10-12 08:36:14

概率统计的相关文章

应用概率统计模板

apsart.cls 1 % !Mode:: "TeX:UTF-8" 2 %% 3 %% This is file `APSart.cls', 4 %% 5 %% Copyright 2006-2012 6 %% 7 %% ---------------------------------------------------------------------- 8 %% 9 %% It may be distributed and/or modified under the 10 %

概率统计 - 07 随机事件及其概率

概率统计 - 07 随机事件及其概率 一.随机事件 1.随机试验与样本空间 2.随机事件与集合 3.事件的关系与运算 二.事件的概率 1.古典概率 2.概率的性质 3.古典概率的计算 4.概率的统计定义 三.事件的独立性 1.条件概率 2.乘法公式 3.事件的独立性 4.全概率公式 概率统计 - 07 随机事件及其概率,码迷,mamicode.com

概率统计----协方差

????机器视觉中,常用到协方差相关的知识,特别是基于统计框架下的机器学习算法,几乎无处不在的用到它,因此了解协方差是再基础不过的了.这里推荐一个很不错的基础教程:协方差的意义和计算公式 均值和方差 引入协方差之前,先简单回顾下概率统计中的两个重要基础概念:均值和方差.均值,顾名思义就是一堆样本的平均值,方差就是样本和均值的平均偏差.对于给定的n个样本,那么样本集的均值和方差可以分别这样来定义: 名称 公式 解释 均值 样本的平均值,即样本的中心点,例如{1 2,3,4}的均值是2.5 标准差

概率统计 - 08 随机变量及其概率分布

概率统计 - 08 随机变量及其概率分布 一.离散型随机变量及其分布律1.随机变量2.离散型随机变量3.两点分布4.二项分布5.泊松分布 二.连续型随机变量及其概率密度1.连续型随机变量2.均匀分布3.指数分布 三.分布函数与函数的分布1.分布函数2.函数的分布 四.正态分布1.正态分布的定义与性质2.正态分布的概率计算 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com

统计思维-程序员数学之概率统计-云图

封面 简介 本书是一本全新的概率统计入门教材,重点介绍如何用统计学方法分析大型数据集.本书会介绍如何使用计算机实现各种统计方法,这有诸多优点. 学生可以通过编写程序来深化和检查自己对概念的理解. 例如, 编写计算最小二乘拟合. 残差和判定系数的函数, 编写和测试这些代码需要他们正确理解相关概念,消除各种可能的误解. 学生能够通过计算实验来验证统计学上的一些定理. 例如, 生成服从各种分布的样本来验证中心极限定理(Central Limit Theorem,CLT). 当发现服从帕累托分布的样本并

《统计思维程序员数学之概率统计第2版》中英文PDF+数据代码+《面向数据科学家的实用统计学》中英文PDF+源代码+学习总结

作为一个程序员,我认为,不需要把数学全部学完,要选择合适自己的资料. <统计思维:程序员数学之概率统计(第2版)>以程序模拟的方式而不是数学教材上毫无来由的定理解释了大多数统计上的基本概念.<统计思维:程序员数学之概率统计(第2版)>,中文PDF,带书签目录,204页,文字可以复制.<统计思维:程序员数学之概率统计(第2版)>,英文PDF,带书签目录,225页,文字可以复制. 配套python源代码+数据. 下载:https://pan.baidu.com/s/1Jju

概率统计21——指数分布和无记忆性

指数分布(Exponential distribution)是一种连续型概率分布,可以用来表示独立随机事件发生的时间间隔的概率,比如婴儿出生的时间间隔.旅客进入机场的时间间隔.打进客服中心电话的时间间隔.系统出现bug的时间间隔等等. 指数分布的由来 指数分布与泊松分布存在着联系,它实际上可以由泊松分布推导而来. 泊松分布(概率统计15)中已经介绍过泊松分布,除了作为二项分布的近似外,当独立事件发生的频率固定时,泊松分布还可以刻画算单位时间内事件发生次数的概率分布. 假设某个公司有一个带伤上线的

概率统计&假设检验-1

看实验的时候感觉自己在统计方面好欠缺 所以现在来填坑=.= ××××××××××××我是快乐的小学渣×××××××××××××××××××××××××××××××××× (参考http://blog.sina.com.cn/s/blog_6b1c9ed50101l02a.html) (1)p-value:表征了在原假设成立的条件下,重复进行当前的试验,获得现有统计量t及其更极端情况的概率. 用来判断是否拒绝原假设.如果p小于给定的α(显著性水平:犯一类错误的概率.错误拒绝原假设的最大概率),则拒

概率统计基本概念总结

一.概率论基本概念样本空间.随机事件频率和概率概率的相关运算和性质等可能概型:古典概型条件概率全概率公式:你用条件概念算事件概率贝叶斯公式:条件概率用于反推计算条件概率事件的相互独立性二.随机变量极其分布随机变量:每个样本点映射一个数字来表征基本离散型随便基变量分布:0-1分布.伯努利实验二项分布.泊松分布分布函数:随机变量概率在小于某随机变量的区间的概率和概率密度函数:连续性的随即变量的概率密度分布函数,分布函数是密度函数的定积分.概率密度的几种分布:均匀分布.指数分布.正态分布.随机变量之间