概率与统计 知识回顾(二) 一维随机变量及概率分布

1 随机变量的概念

顾名思义,随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离。但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理。

根据随机变量其可能取的值的全体的性质,可以把随机变量分为2大类,一类是离散型随机变量;一类是连续型随机变量。但是连续型变量这个概念只是数学上的抽象,因为任何量都有单位,都只能在该单位下量到一定的精度,所以也一定是离散的。

2 离散型随机变量的分布

定义1.2.1 设$X$为离散型随机变量,其全部的可能值为$\{a_1,a_2,\dots\}$,则

$$p_i=P(X=a_i), i=1,2,\dots$$

称为$X$的概率函数。且有下面的性质:

$$p_i\geqslant 0,p_1+p_2+\dots=1$$

$X$的概率函数给出了:全部概率1是如何在其可能的值之间分配的,所以也把它称为随机变量$X$的“概率分布”。

定义1.2.2 设$X$为一随机变量,则函数

$$P(X\le x)=F(x),-\infty<x<\infty$$

称为$X$的分布函数。

对离散型随机变量而言,概率函数与分布函数在下述意义下是等价的。

$$F(x)=P(X\le x)=\sum_{\{i:a_i\le x\}}p_i$$

由$p_i$求$F(x)$是显然的,而由$F(x)$求$p_i$,只需注意:

$$F(i)=P(X\le i)=P(X\le i-1)+P(X=i)$$

对于任何随机变量$X$,其分布函数$F(x)$具有下面的一般性质:

1)$F(x)$是单降非降的:当$(x_1<x_2)$时,有$F(x_1)\le F(x_2)$;

2)当$x\to\infty$时,$F(x)\to 1$;当$x\to –\infty$时,$F(x)\to 0$;

3 几个常见的离散型分布

二项分布$X\sim B(n,p)$

$$p_i=b(i;n,p)=\dbinom{n}{i}p^i(1-p)^{n-i},i=0,1,\dots,n$$

泊松分布

$X\sim P(\lambda)$,此处$\lambda>0$是一常数

$$P(X=i)=e^{-\lambda}\lambda^i/i!$$

超几何分布

设有N个产品,其中有M个不合格品,若从中不放回地随机抽取$n$个,则其中含有的不合格品的个数$X$服从超几何分布,记为$X\sim h(n,N,M)$,超几何分布的概率分布列为:

$$P(X=k)=\frac{\dbinom{M}{k}\dbinom{N-M}{n-k}}{\dbinom{N}{n}},k=0,1,\dots,r$$

其中$r=min\{M,n\}$,且$M\le N,n\le N,n,N,M均为正整数$

当$n\gg N$时,即抽取个数$n$远小于产品总数N时,每次抽取后体中的不合格率$p=M/N$改变甚微,所以不放回抽样,可以近似地看成回抽样,这里超几何分布可以用二项分布近似。

$$\frac{\dbinom{M}{k}\dbinom{N-M}{n-k}}{\dbinom{N}{n}}\cong\dbinom{n}{k}p^k(1-p)^{n-k},其中p=\frac{M}{N}$$

几何分布$X\sim Ge(p)$

$$P(X=k)=(1-p)^{k-1}p,k=1,2,\dots$$

几何分布的无记忆性:设$X\sim Ge(p)$,则对任意正整数m与n有

$$P(X>m+n|X>m)=P(X>n)$$

上面这个公式表明在一系列的事件中,若前m次实验中事件A没有出现,则接下来的n次试验中A仍未出现的概率只与n有关,似乎忘记了前m次试验结果。

负二项分布$X\sim Nb(r,p)$,

在伯努利试验序列中,记每次试验中事件A发生的概率为$p$,如果$X$为事件$A$第r次出现时的试验次数,则$X$可能的取值为$r,r+1,\dots,r+m,\dots$

$$P(X=k)=\dbinom{k-1}{r-1}p^r(1-p)^{k-r},k=r,r+1,\dots$$

4 连续型随机变量分布

对于连续型变量的概率分布,不能用像离散型变量那种方法去描述。原因在于,这种变量的取值充满一个区间,无法一一排出。

刻画连续型随机变量的概率分布的一个方法是利用概率分布函数,但是在理论和实用上更方便因则更常用的方法,是使用所谓“概率密度函数”或简称密度函数。

定义1.4.1 设连续性随机变量X有概率分布函数$F(x)$,则$F(x)$的层数$f(x)=F’(x)$,称为X的概率密度函数。

连续型随机变量$X$的密度函数$f(x)$都具有以下三条基本性质:

1)$f(x)\ge0$

2)$\int_{-\infty}^{\infty}f(x)dx=1$

3)对任何常数$a<b$有$P(a\le X\le b)=F(b)-F(a)=\int_{a}^{b}(x)dx$

正态分布

由中心极限定理可知:

一个变量如果是由大量微小的、独立的随机因素的叠加结果,那么这个变量一定是正态变量。因此很多随机变量可以用正态分布描述或近似描述,譬如测量误差、产品重量、人的身高、年降雨量等。

若随机变量$X$的密度函数为

$p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty$

称$X$服从正态分布或高斯分布。

均匀分布

若随机变量$X$的密度函数为

$$p(x)=\begin{cases}\frac{1}{b-a},&a<x<b; \\ 0,&其他。\end{cases}$$

则称$X$服从区间$(a,b)$上的均匀分布,记作$X\sim U(a,b)$

指数分布

若随机变量$X$的密度函数为

$$p(x)=\begin{cases}\lambda e^{-\lambda x},&x\ge0; \\ 0 , & x<0。\end{cases}$$

则称$X$服从指数分布,记作$X\sim Exp(\lambda)$

因为指数分布随机变量只可能取非负实数,所以指数分布被用作各种“寿命”分布,譬如电子元件的寿命,动物的寿命等。

概率与统计 知识回顾(二) 一维随机变量及概率分布

时间: 2024-10-04 16:05:42

概率与统计 知识回顾(二) 一维随机变量及概率分布的相关文章

概率与统计 知识回顾(一) 事件的概率

一.概率是什么 概率是表示某种情况(事件)出现的可能性大小的一种数量指标,它介于0与1之间. 1.1 主观概率 凭着经验和知识对事件发生的可能性作出的一种主观估计,主观概率可以理解为一种心态或倾向性. 1.2 等可能试验 假定某个试验有有限个可能的结果$e_1,e_2,\dots,e_N$.假定从该试验的条件及实施方法去分析,我们找不到任何理由认为其中某一结果,例如$e_i$,比任一其他结果,例如$e_j$,更具有优势(即更倾向于易发生),则我们只好认为,所有结果$e_1,e_2,\dots,e

一维随机变量及其概率分布

1. 随机变量的概念 顾名思义,随机变量就是“其值随机会而定”的变量.随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离.但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理. 根据随机变量其可能取的值的全体的性质,可以把随机变量分为2大类,一类是离散型随机变量,比如检验100件产品中的次品个数:一类是连续型随机变量,比如一个灯泡的寿命.但是连续型变量这个概念只是数学上的

JavaWeb知识回顾二

动态web资源相关 1.tomcat相关 tomcat的目录结构 bin -- tomcat服务器的批处理文件的存放目录 conf -- tomcat服务器配置文件的存放目录 lib -- tomcat服务器运行时所依赖的jar包的存放目录 logs -- tomcat服务器运行时产生的日志文件的存放目录 temp -- tomcat服务器运行时产生的临时文件的存放目录 tomcat的三种部署web应用的方式 1.在tomcat/conf/server.xml中<host>下添加<Con

MATLAB 一维随机变量及其概率分布

1.两点分布 clc clear a=rand(1,10); for ii=1:10 if a(ii)<0.2 a(ii)=0; else a(ii)=1; end end a x=0的概率为0.2,x=1的概率为0.8:两点分布 clc clear a=rand(1,10); b=(a>0.2) 循环用向量化表示 2.伯努利分布(二项分布) clc clear N=1000000; r=binornd(19,0.3,1,N);%A事件发生概率0.3,重复19次.事件A发生的次数.仿真1000

概率统计 - 08 随机变量及其概率分布

概率统计 - 08 随机变量及其概率分布 一.离散型随机变量及其分布律1.随机变量2.离散型随机变量3.两点分布4.二项分布5.泊松分布 二.连续型随机变量及其概率密度1.连续型随机变量2.均匀分布3.指数分布 三.分布函数与函数的分布1.分布函数2.函数的分布 四.正态分布1.正态分布的定义与性质2.正态分布的概率计算 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com

JS基础知识回顾:引用类型(二)

ECMAScript中的Date类型是在早期Java中的java.util.Date类基础上构建的. 因此,Date类型使用自UTC(Coordinated Universal Time,国际协调时间)1970年1月1日午夜零点开始经过的毫秒数来保存日期. 在使用这种数据存储格式的条件下,Date类型保存的日期能够精确到1970年1月1日或之后的285616年. 要创建一个日期对象,使用new操作符和Date构造函数即可:var now=new Date(); 在调用Date构造函数而不传递参数

JS基础知识回顾:ECMAScript的语法(二)

ECMAScript中有五种简单数据类型(也称为基本数据类型):Undefined.Null.Boolean.Number.String ECMAScript还有一种复杂数据类型——Object,Object本质上是由一组无序的名值对组成的. ECMAScript不支持任何创建自定义类型的机制,而所有值最终都将是上述六种数据类型之一,由于ECMAScript的数据类型具有动态性,因此的确没有再定义其他数据类型的必要了. 监狱ECMAScript是松散类型的,因此需要有一种手段来检测给定变量的数据

第三部分 概率_2 一维随机变量的分布

2. 一维随机变量的分布 (1)随机变量 类型-----根据取值情况的不同可以将随机变量分为离散随机变量和连续随机变量 概率分布-----随机变量一切可能值或范围的概率的规律 (2)常见离散分布 1)两点分布 随机变量X值可能取0和1两个值,则分布为 X 0 1 Pk 1-P P 则称X服从(0--1)分布或者两点分布 2)二项分布 在一次试验E中只考虑两个互逆的结果A或者,这样的试验称为伯努利试验. n重伯努利试验:将伯努利试验E独立(表示每次试验的结果都互不影响)的重复(表示在这n次试验中P

C#基础知识回顾

C#基础知识回顾          相同数据类型不同的定义变量方式. int a = 5; Int32 b = 6; long c = 4; Int64 d = 4; double e = 3.14; Double f = 3.14; float g = 3.14f; Single h = 3.14f; bool aa = true; Boolean bb = true; string s = "Hello"; String ss = "Hello";   数据类型