概率分布汇总

首先我们需要搞清楚几个概念:概率函数、概率分布、概率密度

我这里只做简单阐述,意在理解概念,可能不严谨。

我们知道变量可分为离散随机变量和连续随机变量;

概率函数:随机变量取某个值的概率

pi=P(X=ai)(i=1,2,3,4,5,6);以骰子为例,每次摇骰子取值为 1-6,取每个数字的概率为 1/6,这就是离散概率函数;

pi=P(X<170);以身高为例,小于 170 的概率,这就是连续概率函数

描述了取某个值或者某一个区间的概率

概率分布:也叫累积概率函数,随机变量取某些值的概率,也就是取这些值的概率的累加和

pi=P(X=[1, 2])

pi=P(X<170  and X>165)

描述了取某些值或某些区间的概率

概率密度:它只针对连续型随机变量,连续型随机变量的概率函数也叫概率密度

数学上用如下公式表示概率密度

可以看到 X 的取值是连续的,P 是一个积分

F(x) 左图表示连续型随机变量的概率分布;f(x) 右图表示连续型随机变量的概率密度;

f(x) 是 F(x) 的导数

均匀分布

应该说是最简单的分布,它是指在一个取值范围内取到每个值的概率相等;

对于离散型随机变量,概率函数

P(X)=1/a-b  a<b 代表取值范围

对于连续型随机变量,就是可以等概率地取 a b 之间的任一个数

期望:u=(a+b)/2;方差:var=(a-b)2/12

扩展

它适用于连续型变量和离散型变量

场景描述

投骰子

高斯分布

也叫正态分布,是最常见的分布,世界上大部分数据应该是满足高斯分布的,其图形如下

均匀的分布在某点两侧,当然没那么平滑也算高斯,大部分没这么平滑

伯努利分布

也叫两点分布;

稍微官方的概念:在相同条件下重复 n 次试验,如果每次试验只有两个相对立的事件,且各次试验中发生的概率不变,我们成这样的试验为 n 重伯努利试验

通俗解释:只有两个结果的事件;如抛硬币

我们一般把结果即为 {0, 1},如抛硬币 0 是反面,1 是正面;

而且我们通常把 1 发生的概率记为 P(x=1) = p,那么 0 发生的概率则为 P(x=0) = 1-p;

那么 x 的概率可记为 P(x) = px(1-p)1-x   (x 取值 0,1 )

说的官方点,x 服从参数为 p 的伯努利分布

期望:E(x) = p;方差:var(x) = p(1-p)

扩展

1. 伯努利分布是离散型分布

2. 逻辑回归二分类就是伯努利分布

场景描述

抛一次硬币

二项分布

接着 伯努利分布 讲,我们做 n 次独立实验得到 结果集 D, 其中正面朝上的事件发生了 x 次,如果 n 为 1,就是伯努利分布,如果 n 大于 1,则为二项分布,其概率函数为

 p 为每次正面朝上的概率

期望:E(x) = np;方差:var(x) = np(1-p)

扩展

1. 二项分布也是离散型分布

2.  还以 逻辑回归 为例,如果只有一个模型,结果服从 伯努利分布; 如果进行有放回的抽样,训练 多个模型,则结果服从 二项分布;这里是不是有点像 bagging?

3. 当 p = 1 - p,即 p = 0.5 时,二项分布的直方图(或者概率条形图)是对称的,很容易理解,或者举个例子带入公式也可理解

4. 当 n 趋近于无穷大时,二项分布近似等于正态分布,也就是说,正态分布是二项分布的极限

场景描述

抛 n 次硬币,当我们抛了无穷多次,那不就是正态分布吗

泊松分布

适合描述单位时间(空间)内随机事件发生的次数

比如有 100 个人,其中有 1 个男性的概率?有 2 个男性的概率? 假如我有个先验知识,所有人中男性的占比为 60%,就能计算有 k 个男性的概率

 λ 即为先验概率, k 为发生次数

期望和方差都是 λ

扩展

1. 从定义来看,好像和 二项分布 差不多啊,他们之间确实有关系;

从概念上讲,泊松分布适合实验次数多,且单位时间发生的概率很低的情况,如交通事故;

当 n 很大 p 很小时,二项分布近似等于泊松分布,其中 λ 为 np

从数学上讲,二项分布可以推导出泊松分布

2. 泊松分布可以近似地看成离散变量的高斯分布

场景描述

泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等

指数分布

接着 泊松分布 讲,泊松分布用于单位时间内发生的次数,

但是如果发生了 0 次,也就是没有发生,则泊松分布为 P(X=0)=e;也就是说发生的概率是 P(X!=0)=1 - e,发生而不管发生了多少次;

同时我们也可以把 发生了 x 次记为 发生,那么每次发生的概率 为 xλ,所以我们可以把指数分布扩展为

P(X<x) = e-xλ    没发生

P(X>x) = 1 - e-xλ    发生

期望:u=1/λ;方差:var=1/λ2

扩展

1. 所以指数分布常用于会不会发生

2. 指数分布和泊松分布有一定联系

场景描述

机器是否会故障

参考资料:

https://blog.csdn.net/u014296502/article/details/81069042

https://blog.csdn.net/lin360580306/article/details/51228966

http://www.raincent.com/content-10-10914-1.html

https://blog.csdn.net/weixin_44355973/article/details/98473503

https://baike.baidu.com/item/%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83/1442110?fr=aladdin

原文地址:https://www.cnblogs.com/yanshw/p/11758788.html

时间: 2024-08-05 23:44:04

概率分布汇总的相关文章

部署OpenStack问题汇总(四)--openstack中nova-compute状态status显示为&#39;XXX&#39;的问题

第一次部署openstack的时候就遇见了这个问题,当时的版本是havana, 现在部署essex的时候又遇到了这个问题,经过一番折腾,解决了这个问题,记录下来,以免以后忘记. =========================================================== 1.查看/var/log/nova/nova-compute.log文件其中出现了这样的情况: Domain not found: no domain with matching name 'insta

Nginx&Apache&PHP参数汇总

1.Nginx vim /etc/nginx/conf.d/www.cmdschool.org.conf   client_max_body_size 30m; //上传文件大小改30M   upstream www.cmdschool.org {     server 10.168.82.25:87;     ip_hash;   }   server {     listen 80;     server_name www.cmdschool.org;     location / {   

跟我学SpringMVC目录汇总贴、PDF下载、源码下载

跟我学SpringMVC目录汇总贴.PDF下载.源码下载 http://jinnianshilongnian.iteye.com/blog/1752171 跟开涛学SpringMVC 在线版目录 第一章 Web MVC简介 第二章 Spring MVC入门 第三章 DispatcherServlet详解 第四章 Controller接口控制器详解(1) 第四章 Controller接口控制器详解(2) 第四章 Controller接口控制器详解(3) 第四章 Controller接口控制器详解(

EIGRP汇总后生成的Null0接口和路由黑洞详解

提到Null0接口,就顺便提一下路由黑洞.所谓黑洞路由,顾名思义他就是将所有无关路由吸入其中,使它们有来无回的路由 - 相当于洪水来临时,在洪水途经的路上附近挖一个不见底的巨大深坑,然后将洪水引入其中. 黑洞路由实际是一种特殊的静态路由,就是目的地址为该网段的数据报文到达设备之后,报文将被丢弃.路由黑洞最大的好处是充分利用了路由器的3层数据包转发能力,对系统负载影响非常小,将报文丢弃的操作不需要CPU进行什么专门的处理,所以处理大量的报文也不会消耗设备的CPU资源! 例如,admin建立一个路由

WebGL 支持检测与已支持浏览器版本汇总

太阳火神的美丽人生 (http://blog.csdn.net/opengl_es) 本文遵循"署名-非商业用途-保持一致"创作公用协议 转载请保留此句:太阳火神的美丽人生 -  本博客专注于 敏捷开发及移动和物联设备研究:iOS.Android.Html5.Arduino.pcDuino,否则,出自本博客的文章拒绝转载或再转载,谢谢合作. 是否我的浏览器支持 WebGL http://caniuse.com 在页面搜索 webgl,找到  WebGL - 3D Canvas grap

TCP 协议难点汇总

本文不会完整的介绍TCP,只有在涉及到的时候随便提一下.不适合对TCP整个流程和框架没有了解过的人阅读. 1  TCP 四次挥手中的TIME_WAIT状态的意义何在. 下图四次挥手的一个大体的流程 我们发现在A发送完一个最后一个ACK后,B一收到这个ACK就证明关闭请求已经被确认了,所以可以直接关闭.但是这时候A怎么知道这个ACK是否已经到达了对端呢?这个时候为了保证双方能够正常关闭,就引入了一个MSL时间,MSL定义 "一个电磁波信号在地球最大的存活时间 " . 所以该ACK存活一个

Unity Pitfall 汇总

[Unity Pitfall 汇总] 1. 当脚本被绑定到一个对象时,一个类对象即会被创建,此意味着此类构造函数会被调用.需使用UNITY_EDITOR宏来避免在编辑器中调用构造函数. to be continue Unity Pitfall 汇总,布布扣,bubuko.com

c语言全局变量和局部变量问题汇总

1.局部变量是否能和全局变量重名? 答:能,局部会屏蔽全局.要用全局变量,须要使用"::" 局部变量能够与全局变量同名,在函数内引用这个变量时,会用到同名的局部变量,而不会用到全局变量.对于有些编译器而言,在同一个函数内能够定义多个同名的局部变量,比方在两个循环体内都定义一个同名的局部变量,而那个局部变量的作用域就在那个循环体内. 2.怎样引用一个已经定义过的全局变量? 答:extern 能够用引用头文件的方式,也能够用externkeyword,假设用引用头文件方式来引用某个在头文件

Vue常用经典开源项目汇总参考-海量

Vue常用经典开源项目汇总参考-海量 Vue是什么? Vue.js(读音 /vju/, 类似于 view) 是一套构建用户界面的 渐进式框架.与其他重量级框架不同的是,Vue 采用自底向上增量开发的设计.Vue 的核心库只关注视图层,并且非常容易学习,非常容易与其它库或已有项目整合.另一方面,Vue 完全有能力驱动采用单文件组件和 Vue 生态系统支持的库开发的复杂单页应用. Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件. 易用(已经会了HTML,CSS,J