(二)概率论之随机变量

1. 什么是随机变量?

在(一)中已经介绍
样本空间$\Omega$和基本事件$\omega$,若对任意$\omega$有唯一$X(\omega) \in
R$,我们则称$X$为随机变量(取值函数)。注意$\{\omega|X(\omega)=x\}\subset \Omega
$,一般简写

\[P(\{\omega|X(\omega)=x\})=P(X=x)\]

有时我们不仅要知道$P(X=x)$的值,也需要知道$P(a\leq X \leq b)$和$P(X\leq x)$,$P(X \geq
x)$的值。根据事件之间的运算和柯尔莫哥洛夫三公理,我们选取

\[F(x)=P(X\leq x)\]

作为我们研究的对象,称$F(x)$为分布函数(acmulative distribution
function)。当然也可以定义其他类型的“分布函数”,。关于随机变量的研究是概率论的中心内容。我们这样定义的分布函数有下面的性质:

(i)
 $F(-\infty)=0,F(+\infty)=1$

(ii)
$F(x)$是单调递增的

(iii) 分析$F(x)$的连续性和可微性已经涉及到极限运算

根据随机变量的取值类型,随机变量可以分为离散型随机变量连续型随机变量。对离散型随机变量称$P(X=x)$为概率质量函数。比较常见的有

(1) 二项分布

抛硬币实验,假设硬币材质均匀,抛$n$次,有$k$次都是正面朝上,这个事件的概率是多大呢?这是古典概率的东西,无非是排列组合。

\[P(X=k)=C_{n}^{k}(\frac{1}{2})^{n-k}(\frac{1}{2})^{k}\]

当硬币材质非均匀时,设朝上的概率为$p$,并记朝上为成功事件则

\[P(X=k)=C_{n}^{k}p^{k}(1-p)^{n-k}\]

我们能算出上述$k$取多少时,概率达到最大。有了上面的概率质量函数,分布函数是容易求出的无非是有限项的和。

引入极限,当$n \to
\infty$时,我们需要一些近似估计便于计算。日后再表。另一种极限就是$p$很小时的估计。

二项分布$b(n,p)$及其重要,它和$Possion$分布以及大名鼎鼎的$Gauss$分布都存在血缘关系,可以算作他们的Father.
概率论发源早期也着重在

(2) 几何分布

进行一项独立实验例如抛硬币,直至出现正面事件成功概率为$p$,结束实验,问在第$k$次实验成功的概率是多少?

\[P(X=k)=(1-p)^{k-1}p\]

(3)
Possion分布

一段时间内,某交通路口所发生的交通事故的个数?

解决这个问题的基本思路是这样的,将时间$[0,
1]$划分$n$段,$n$足够大以至于在这么短暂的时间内只能发生一次事故,发生事故的概率与时间长成正比$\frac{\lambda}{n}$。$k$起事故服从二项分布,概率为

\[P(x=k)=C_{n}^{k}(\frac{\lambda}{n})^{k}(1-\frac{\lambda}{n})^{n-k}\]

令$n \to
\infty$得到

\[P(X=k)=e^{-\lambda}\frac{\lambda^{k}}{k!}\]

上述分布称为$Possion$分布,从上可看出$p=n\lambda$,$n$很大时$p$很小,当$p
\leq 0.003$时称为小概率事件,$\lambda$具有统计学意义“均值”。

下面介绍常见的连续型随机变量的分布:

首先引入概率密度函数$f(x)$,概率密度函数是累积分布函数$F(x)$的导数,有下面的三条性质:

(i) $f(x)\geq
0$

(ii)
$\int_{-\infty}^{+\infty}f(x)dx=1$

(iii)$P(a\leq x \leq
b)=F(b)-F(a)=\int_{-\infty}^{+\infty}f(x)dx$

(4) Gauss 分布

 
  
这个分布是所有分布里最重要的分布

\[f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma
^{2}}}\]

关于这个分布的来源很多教课书没有作太多的介绍,她是和误差估计、最小二乘法、中心极限定理等相关的,网络上有一篇非常著名的文章《关于正态分布的前世今生》作了详细介绍,非常精彩。

当$\mu=0,\sigma=1$时

\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2}\]

(二)概率论之随机变量

时间: 2024-10-27 07:25:53

(二)概率论之随机变量的相关文章

概率论04 随机变量-离散-连续

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 我们了解了"样本空间","事件","概率".样本空间中包含了一次实验所有可能的结果,事件是样本空间的一个子集,每个事件可以有一个发生的概率.概率是集合的一个"测度". 这一讲,我们将讨论随机变量.随机变量(random variable)的本质是一个函数,是从样本空间的子集到实数的映射,将事件转换成一个数值.根

信息论-熵-随机变量-泛函

一. 熵的定义: 原始熵的定义:克劳修斯(T.Clausius) 于1854年提出熵(entropie)的概念, 我国物理学家胡刚复教授于1923年根据热温商之意首次把entropie译为"熵".熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量.统计热力学: 熵的大小与体系的微观状态Ω有关,即S=klnΩ,其中k为玻尔兹曼常量,k=1.3807x10-23J·K-1.体系微观状态Ω是大量质点的体系经统计规律而得到的热力学概率,因此熵有统计意义,对只有几个

第三部分 概率_3 多维随机变量的分布

3. 多维随机变量的分布 (1)多项分布 可参见https://blog.csdn.net/jteng/article/details/54632311 多项分布是对二项分布的扩展,二项分布是单变量分布,而多项分布式多变量分布. 二项分布每次试验试验只有两种结果,而多项分布每次试验则会有多种可能性,那么进行多次的试验后,多项分布描述的就是每种可能发生次数的联合概率分布. (2)Gamma函数 首先说一下先验概率和后验概率的区别,然后再进行下面的步骤: 验前概率就是通常说的概率: 验后概率是一种条

马尔可夫链

原文:http://blog.sina.com.cn/s/blog_5398194701011yv6.html 马尔柯夫预测法 马尔柯夫预测法:马尔柯夫预测以俄国数学家A.A.Markov名字命名,是利用状态之间转移概率矩阵预测事件发生的状态及其发展变化趋势,也是一种随时间序列分析法.它基于马尔柯夫链,根据事件的目前状况预测其将来各个时刻(或时期)的变动状况.  1. 马尔柯夫链.状态是指某一事件在某个时刻(或时期)出现的某种结果.事件的发展,从一种状态转变为另一种状态,称为状态转移.在事件的发

从朴素贝叶斯分类器到贝叶斯网络(下)

书接上文 :从朴素贝叶斯分类器到贝叶斯网络(上) 三.贝叶斯网络 贝叶斯网络(Bayesian Network)是一种用于表示变量间依赖关系的数据结构.有时它又被称为信念网络(Belief Network)或概率网络(Probability Network).在统计学习领域.概率图模型(PGM,Probabilistic Graphical Models)经常使用来指代包括贝叶斯网络在内的更加宽泛的一类机器学习模型.比如隐马尔可夫模型(HMM,Hidden Markov Model)也是一种PG

转 马尔柯夫预测法

http://blog.sina.com.cn/s/blog_5398194701011yv6.html 马尔柯夫预测法 马尔柯夫预测法:马尔柯夫预测以俄国数学家A.A.Markov名字命名,是利用状态之间转移概率矩阵预测事件发生的状态及其发展变化趋势,也是一种随时间序列分析法.它基于马尔柯夫链,根据事件的目前状况预测其将来各个时刻(或时期)的变动状况. 1. 马尔柯夫链.状态是指某一事件在某个时刻(或时期)出现的某种结果.事件的发展,从一种状态转变为另一种状态,称为状态转移.在事件的发展过程中

转载--柯尔莫哥洛夫

柯尔莫哥洛夫 柯尔莫哥洛夫,A.H.(Андрей Николаевич Колмогоров)1903年4月25日生于俄国坦波夫(Тамбов):1987年10月20日卒于苏联莫斯科.数学.大气力学. 柯尔莫哥洛夫的父亲卡塔也夫(Николай Матвеевич Катаев)是农艺师兼作家,母亲柯尔莫哥洛娃(Мария Яковлевна Колмогорова)出身贵族.他们并没有办结婚手续,所以柯尔莫哥洛夫从母姓.十月革命后,卡塔也夫主持农业人民委员部教育部门,在1919年A.И.邓尼

自然语言处理(NLP) - 数学基础(1) - 总述

正如我在<2019年总结>里说提到的, 我将开始一系列自然语言处理(NLP)的笔记. 很多人都说, AI并不难啊, 调现有库和云的API就可以啦. 然而实际上并不是这样的. 首先, AI这个领域十分十分大, 而且从1950年图灵提出图灵测试, 1956年达特茅斯会议开始, AI已经发展了五十多年了, 学术界有的认为有六个时期, 有的认为有三起二落. 所以Ai发展到今天, 已经有相当的规模了, 不可能有一个人熟悉AI的所有领域, 最多也就是熟悉相关联的几个领域, 比如NLP和OCR以及知识图谱相

信号处理基础概念比较----频谱vs功率谱vs能谱

频谱: 对动态信号在频率域内进行分析,分析的结果是以频率为坐标的各种物理量的谱线和曲线,可得到各种幅值以频率为变量的频谱函数F(ω).频谱是个很不严格的东西,常常指信号的Fourier变换.频谱分析中可求得幅值谱.相位普.功率谱和各种密度谱.频谱分析过程较复杂,它是以傅里叶级数和傅里叶分析为基础的. 信号的频谱分为幅度谱和相位谱,幅度谱对应于一阶分析,信号傅里叶变换的幅值在频域的分布称为幅度谱,相位的分布称为相位谱. 功率谱: 功率谱的概念是针对功率有限信号的,所表现的是单位频带内信号功率随频率