1. 什么是随机变量?
在(一)中已经介绍
样本空间$\Omega$和基本事件$\omega$,若对任意$\omega$有唯一$X(\omega) \in
R$,我们则称$X$为随机变量(取值函数)。注意$\{\omega|X(\omega)=x\}\subset \Omega
$,一般简写
\[P(\{\omega|X(\omega)=x\})=P(X=x)\]
有时我们不仅要知道$P(X=x)$的值,也需要知道$P(a\leq X \leq b)$和$P(X\leq x)$,$P(X \geq
x)$的值。根据事件之间的运算和柯尔莫哥洛夫三公理,我们选取
\[F(x)=P(X\leq x)\]
作为我们研究的对象,称$F(x)$为分布函数(acmulative distribution
function)。当然也可以定义其他类型的“分布函数”,。关于随机变量的研究是概率论的中心内容。我们这样定义的分布函数有下面的性质:
(i)
$F(-\infty)=0,F(+\infty)=1$
(ii)
$F(x)$是单调递增的
(iii) 分析$F(x)$的连续性和可微性已经涉及到极限运算
根据随机变量的取值类型,随机变量可以分为离散型随机变量和连续型随机变量。对离散型随机变量称$P(X=x)$为概率质量函数。比较常见的有
(1) 二项分布
抛硬币实验,假设硬币材质均匀,抛$n$次,有$k$次都是正面朝上,这个事件的概率是多大呢?这是古典概率的东西,无非是排列组合。
\[P(X=k)=C_{n}^{k}(\frac{1}{2})^{n-k}(\frac{1}{2})^{k}\]
当硬币材质非均匀时,设朝上的概率为$p$,并记朝上为成功事件则
\[P(X=k)=C_{n}^{k}p^{k}(1-p)^{n-k}\]
我们能算出上述$k$取多少时,概率达到最大。有了上面的概率质量函数,分布函数是容易求出的无非是有限项的和。
引入极限,当$n \to
\infty$时,我们需要一些近似估计便于计算。日后再表。另一种极限就是$p$很小时的估计。
二项分布$b(n,p)$及其重要,它和$Possion$分布以及大名鼎鼎的$Gauss$分布都存在血缘关系,可以算作他们的Father.
概率论发源早期也着重在
(2) 几何分布
进行一项独立实验例如抛硬币,直至出现正面事件成功概率为$p$,结束实验,问在第$k$次实验成功的概率是多少?
\[P(X=k)=(1-p)^{k-1}p\]
(3)
Possion分布
一段时间内,某交通路口所发生的交通事故的个数?
解决这个问题的基本思路是这样的,将时间$[0,
1]$划分$n$段,$n$足够大以至于在这么短暂的时间内只能发生一次事故,发生事故的概率与时间长成正比$\frac{\lambda}{n}$。$k$起事故服从二项分布,概率为
\[P(x=k)=C_{n}^{k}(\frac{\lambda}{n})^{k}(1-\frac{\lambda}{n})^{n-k}\]
令$n \to
\infty$得到
\[P(X=k)=e^{-\lambda}\frac{\lambda^{k}}{k!}\]
上述分布称为$Possion$分布,从上可看出$p=n\lambda$,$n$很大时$p$很小,当$p
\leq 0.003$时称为小概率事件,$\lambda$具有统计学意义“均值”。
下面介绍常见的连续型随机变量的分布:
首先引入概率密度函数$f(x)$,概率密度函数是累积分布函数$F(x)$的导数,有下面的三条性质:
(i) $f(x)\geq
0$
(ii)
$\int_{-\infty}^{+\infty}f(x)dx=1$
(iii)$P(a\leq x \leq
b)=F(b)-F(a)=\int_{-\infty}^{+\infty}f(x)dx$
(4) Gauss 分布
这个分布是所有分布里最重要的分布
\[f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma
^{2}}}\]
关于这个分布的来源很多教课书没有作太多的介绍,她是和误差估计、最小二乘法、中心极限定理等相关的,网络上有一篇非常著名的文章《关于正态分布的前世今生》作了详细介绍,非常精彩。
当$\mu=0,\sigma=1$时
\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2}\]
(二)概率论之随机变量