概率统计——讲透最经典的三种概率分布

本文始发于个人公众号:TechFlow

这一讲当中我们来探讨三种经典的概率分布,分别是伯努利分布、二项分布以及多项分布。

在我们正式开始之前,我们先来明确一个概念,我们这里说的分布究竟是什么?

无论是在理论还是实际的实验当中,一个事件都有可能有若干个结果。每一个结果可能出现也可能不出现,对于每个事件而言出现的可能性就是概率。而分布,就是衡量一个概率有多大。

伯努利分布

明确了分布的概念之后,我们先从最简单的伯努利分布开始。

伯努利分布非常简单,就是假设一个事件只有发生或者不发生两种可能,并且这两种可能是固定不变的。那么,显然,如果假设它发生的概率是p,那么它不发生的概率就是1-p。这就是伯努利分布。

生活中所有只可能出现两种结果并且概率保持不变的事件都可以认为服从伯努利分布,比如抛硬币,比如生孩子是男孩还是女孩。

伯努利实验就是做一次服从伯努利概率分布的事件,它发生的可能性是p,不发生的可能性是1-p。

二项分布

我们明确了伯努利分布之后再来看二项分布就简单了。说白了二项分布其实就是多次伯努利分布实验的概率分布。

以抛硬币举例,在抛硬币事件当中,每一次抛硬币的结果是独立的,并且每次抛硬币正面朝上的概率是恒定的,所以单次抛硬币符合伯努利分布。我们假设硬币正面朝上的概率是p,忽略中间朝上的情况,那么反面朝上的概率是q=(1-p)。我们重复抛n次硬币,其中有k项正面朝上的事件,就是二项分布。

我们来试着推导一下二项分布的公式:

假设我们抛了4次硬币,每一次都有两种可能,既可能正面朝上,也可能反面朝上。所以一共存在\(2^4=16\)种情况,假设我们想知道4次当中有两次正面朝上的概率。我们写成\(P(X=2)\),它应该是多少呢?

我们先来看一种情况,假设某一次抛掷当中,我们的结果是正正反反,记作:OOXX。那么,它的概率应该是\(P=ppqq=p^2q^2\),但是这只是一种正面朝上两次的情况,与它相同的情况还有:

\[
\begin{equation}
P(OXOX)=pqpq=p^2q^2 \P(OXXO)=pqqp=p^2q^2 \P(XOXO)=qpqp=p^2q^2 \P(XOOX)=qppq=p^2q^2 \\
P(XXOO)=qqpp=p^2q^2 \\end{equation}
\]

以上的这5种都是两次正面朝上的情况,都满足要求,所以我们在计算概率的时候,需要乘上可能会导致两个正面朝上的种数。也就是说我们知道某一种\(P(X=2)\)的情况发生的概率是\(p^2q^2\),但是这样的情况一共有6种,所以我们需要乘上6.

那么我们怎么知道在n次试验当中,X=k的情况存在多少种呢?

这里就需要用到排列组合的知识,我想这一块在初高中数学课本上都有涉及。我们简单回顾一下。

排列

排列,指的是从n个项目当中选出k个来排成一排的情况种数。

我们设想一下,假设面前有5个人,我们要选出两个人来排成一排,一共有几种情况呢?由于是排列,所以这带个人的排列顺序是会对结果产生影响的。同样是AB两个人,A和B与B和A会被视为不同的情况。所以,显然第一个人有5种选择,第二个人有4种选择,所以总共有20种选择。

我们推广这个公式,当人数是n,候选人数是k的时候,情况种数应该是:

\[P_n^k=n*(n-1)*(n-2)*\cdots *(n-k+1)=\prod_{i=n}^{n-k+1}i=\frac{n!}{(n-k)!}\]

组合

组合和排列很类似,唯一不同的是在组合当中不用考虑选出项的次序情况。排列是选出人来排成一排,那么组合是选出人来一起去做某件事。这些选出的人先后次序并不重要,重要的是组成。

还是5个人里挑选两个的情况,第一个人有5种选择,第二个人有4种选择。但这里我们还需要去除这选出来的两个人的排列的情况。2个人的排列一共有2种,所以最后的结果是5 * 4 / 2=10.

我们来推导一下公式,n个人里面选k个的排列有\(\frac{n!}{(n-k)!}\),而k个人的全排列有:\(k!\)种,所以两者相除就是组合数的结果:

\[C_n^k=\frac{n!}{(n-k)!k!}\]

我们有了组合的公式之后,带入前文当中二项分布。我们做n次试验,其中有k个发生某事件的情况总数是\(C_n^k\),所以总体的概率\(P(X=k)=C_n^kp^kq^{n-k}\)。

我们明白了二项分布之后,继续来看多项式分布。

多项式分布

多项式分布也很简单,是在二项分布的基础上进一步的拓展。

在现实世界当中,并不是所有事件都只有两个结果,最简单的例子就是骰子。我们每次投骰子会产生1-6,一共6种结果。我们假设这6种结果发生的概率分别是p1, p2, p3, p4, p5和p6,那么显然\(\sum_{i=1}^6p_i=1\)。在多项式分布当中,我们会问进行n次试验,这6种可能性分别出现的次数是(x1, x2, x3, x4, x5, x6)的概率是多少?

显然,如果\(\sum_{i=1}^6x_i \neq n\),那么概率为0. 我们讨论相等时候的情况。

我们先计算一种组合发生的概率,不论这n项的顺序如何,显然都有\(P=p_1^{x_1}p_2^{x_2}\cdots p_6^{x_6}\),那么这样的组合一共有多少个呢?

我们用组合公式来计算,首先是从n项中选出x1项来,一共有:\(C_n^{x_1}=\frac{n!}{(n-x_1)!x_1!}\)。接着我们再选x2项,一共有:\(C_{n-x_1}^{x_2}=\frac{(n-x_1)!}{(n-x_1-x_2)!x_2!}\)。我们依次写出这6项,然后乘到一起,消除同类项之后,得到的结果是:

\[C=\frac{n!}{x_1!x_2!\cdots x_6!}\]

最终的概率就是组合数乘上单个组合的概率:

\[P(x_1, x2, \cdots, x_6)=\frac{n!}{x_1!x_2!\cdots x_6!}p_1^{x_1}p_2^{x_2}\cdots p_6^{x_6}\]

我们对比它和二项分布的公式,会发现,其实二项分布就是多项分布的一种特殊情况。而伯努利分布就是二项分布中n=1的特殊情况。这三种分布虽然各不相同,但是本质之间有着很深的联系,也因此,我们将它们放在一篇文章当中介绍。

到这里,关于这三种分布的介绍就结束了。如果觉得学有收获,就扫码给个关注吧~

原文地址:https://www.cnblogs.com/techflow/p/12204070.html

时间: 2024-08-02 11:37:07

概率统计——讲透最经典的三种概率分布的相关文章

背包九讲之4(混合三种背包问题)

1 /* 2 将01背包,完全背包,和多重完全背包问题结合起来,那么就是混合三种背的问题 3 根据三种背包的思想,那么可以得到 4 混合三种背包的问题可以这样子求解 5 for(int i=1; i<=N; ++i) 6 if(第i件物品是01背包) 7 zeroOnePack(c[i],w[i]); 8 else if(第i件物品是完全背包) 9 completePack(c[i],w[i]); 10 else if(第i件物品是多重完全背包) 11 multiplePack(c[i],w[i

二八原理:员工的三种类型

我估计列位看官中,可能有不少人打算将来往管理方向发展,所以在聊完“二八原理在软件开发的应用”之后,咱们就来聊聊管理方面的话题. 如果你已经在管理岗位上干活,希望后面的帖子能够对你有帮助:如果你尚未担任管理职能,但是将来有这方面的打算,也可以先大概了解一下.事先声明:管理方面帖子聊的内容只是我个人的经验,仅供大伙儿参考 :-) 在开始讲后续的“人员招聘”.“员工激励”等内容之前,先得说一下“三种人”的问题.由于列位看官大都在IT圈内混,所以今天我们就拿软件业来说事.但要记住,三种人的划分其实也适用

类之间的三种关系

前言 一个程序的实现往往涉及到多个类,而类与类之间常常” 有关系 ”.本文将讲述类之间最常见最经典的三种关系. 依赖关系 uses - a 这是最明显,最常见的一种关系.如果一个类的方法需要操控另一个类的对象,我们就说一个类依赖于另一个类. 常见的例子有订单系统中的订单类和账户类,因为订单类需要访问账户类查看其信用状态. 我们应当使这种关系的类最少,也即使类之间的耦合度最小. 聚合关系 has - a 这是最好理解的一种关系,即一个类的对象包含另一个类的对象,我们就说一个类聚合于另一个类. 继承

Android学习之XML数据的三种解析方式以及生成XML文件

首先,我得声明,本博客的思想主要参考了此博客:http://blog.csdn.net/liuhe688/article/details/6415593 不过代码我自己一句句敲的 好了,首先讲一下解析XML的三种方式:(恕我粘贴一下哈) SAX解析器: SAX(Simple API for XML)解析器是一种基于事件的解析器,它的核心是事件处理模式,主要是围绕着事件源以及事件处理器来工作的.当事件源产生事件后,调用事件处理器相应的处理方法,一个事件就可以得到处理.在事件源调用事件处理器中特定方

FS获取KERNEL32基址的三种方法

FS寄存器指向当前活动线程的TEB结构(线程结构) 偏移  说明 000  指向SEH链指针 004  线程堆栈顶部 008  线程堆栈底部 00C  SubSystemTib 010  FiberData 014  ArbitraryUserPointer 018  FS段寄存器在内存中的镜像地址 020  进程PID 024  线程ID 02C  指向线程局部存储指针 030  PEB结构地址(进程结构) 034  上个错误号 在shellcode中用它来找KERNEL32.DLL基地址是常

三天讲透SpringBoot-初识基础使用

这次我们来说一下我们的SpringBoot,现在SpringBoot已经成为趋势,在我这里我用三篇文章的形式来讲清楚我们的SpringBoot,大致分为,第一篇讲搭建,基本使用,第二篇三方集成,自动装配原理,第三篇,将main方法启动原理,总结史上最全的SpringBoot注解及其含义.后面有机会再细致的扒一下源码(书还没看完,怕误导大家). 我们先来看我们的搭建,很简单,我们来一个最小最简洁的启动方式. 三种搭建(一): 准备工作,我们是在IntelliJ IDEA的工具上来讲解的,用Ecli

应用概率统计模板

apsart.cls 1 % !Mode:: "TeX:UTF-8" 2 %% 3 %% This is file `APSart.cls', 4 %% 5 %% Copyright 2006-2012 6 %% 7 %% ---------------------------------------------------------------------- 8 %% 9 %% It may be distributed and/or modified under the 10 %

概率统计 - 07 随机事件及其概率

概率统计 - 07 随机事件及其概率 一.随机事件 1.随机试验与样本空间 2.随机事件与集合 3.事件的关系与运算 二.事件的概率 1.古典概率 2.概率的性质 3.古典概率的计算 4.概率的统计定义 三.事件的独立性 1.条件概率 2.乘法公式 3.事件的独立性 4.全概率公式 概率统计 - 07 随机事件及其概率,码迷,mamicode.com

概率统计 - 08 随机变量及其概率分布

概率统计 - 08 随机变量及其概率分布 一.离散型随机变量及其分布律1.随机变量2.离散型随机变量3.两点分布4.二项分布5.泊松分布 二.连续型随机变量及其概率密度1.连续型随机变量2.均匀分布3.指数分布 三.分布函数与函数的分布1.分布函数2.函数的分布 四.正态分布1.正态分布的定义与性质2.正态分布的概率计算 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com 概率统计 - 08 随机变量及其概率分布,码迷,mamicode.com