概率论Q

Q:

----------------

------------------------

泊松分布最常见的一个应用就是,它作为了排队论的一个输入。

比如在一段时间t(比如 1 个小时)内来到食堂就餐的学生数量肯定不会是一个常数(比如一直是 200 人),而应该符合某种随机规律:

假如在 1 个小时内来 200 个学生的概率是 10%,来 180 个学生的概率是 20%……一般认为,这种随机规律服从的就是泊松分布。

这个
分布是S.-D.泊松研究二项分布的渐近公式时提出来的。泊松分布P (λ)中只有一个参数λ ,它既是泊松分布的均值,也是泊松分布的方差。生活中,当一个随机事件,例如来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布。

其实泊松分布在日常中还是很好辨别的,因为他有一个累计的过程。曾看到一篇用泊松分布来分析美国治安的例子,引来给大家看看: 美国枪击案假定它们满足"泊松分布"的三个条件:

(1)枪击案是小概率事件。 
  (2)枪击案是独立的,不会互相影响。

(3)枪击案的发生概率是稳定的。 
显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。根据资料,1982--2012年枪击案的分布情况如下:

计算得到,平均每年发生2起枪击案,所以 λ = 2 。

上图中,

蓝色的条形柱是实际的观察值,

红色的虚线是理论的预期值。

可以看到,

观察值与期望值还是相当接近的。

我们用"卡方检验",检验观察值与期望值之间是否存在显著差异。卡方统计量 = Σ[(观察值-期望值)^2/期望值] 
        计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。 
       但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。

泊松分布实例:

例子1:  时间段

1). 背景: 我们想要测量 某餐厅 drive-through 周末早上, 15 分钟间隔内 顾客的人数.

假设顾客在不同的15分钟间隔内到达餐厅的概率是相同的,并且相互不影响, 这样我们就可以使用Poisson Distribution, 根据历史数据 周末早上15 分钟间隔内到达餐厅的人数平均值是 10, 在这种情况下我们能构建PMF

P( X ) = (10^x * e^-10) / x!  其中lambda是固定已知的,此处为10.

P( 5 ) = (10 ^ 5 * e ^-10)/5! = 0.0378

2). 根据1) 我们可以知道 以 15分钟为间隔的来5个顾客的概率是 0.0378, 但是如果我们想要知道 以 3 分钟Wie间隔的来5个顾客的概率呢?

解:  我们可以根据历史数据 计算每分钟来的人数 10 / 15 = 2/3; 然后 2/3 * 3 计算出 历史数据 3mins间隔下的顾客人数为2. 使用 P( 5 )计算出相对应的概率.

例子2: 长度/距离

背景: 我们想要知道新建的高速公路上每隔3英里, 产生的会有多少个坑, ( 前提条件不赘述), 根据历史数据, 每英里会有2 个坑, 则平均为 6. 构建PMF (x) = (6^x * e^-6) / x!

PMF( 概率质量函数 ): 是对 离散随机变量 的定义. 是 离散随机变量 在各个特定取值的概率. 该函数通俗来说,就是 对于一个离散型概率事件来说, 使用这个函数来求它的各个成功事件结果的概率.

PDF ( 概率密度函数 ): 是对 连续性随机变量 的定义. 与PMF不同的是 PDF 在特定点上的值并不是该点的概率, 连续随机概率事件只能求一段区域内发生事件的概率, 通过对这段区间进行积分来求. 通俗来说, 使用这个概率密度函数 将 想要求概率的区间的临界点( 最大值和最小值)带入求积分. 就是该区间的概率.

各种分布及应用场合(建模对象)
http://www.360doc.com/content/14/0110/18/15459877_344179498.shtml

时间: 2024-10-18 06:29:59

概率论Q的相关文章

数据挖掘中所需的概率论与数理统计知识

http://blog.csdn.net/v_july_v/article/details/8308762 数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学简史,因为,

【概率论与数理统计】小结3 - 一维离散型随机变量及其Python实现

注:上一小节对随机变量做了一个概述,这一节主要记录一维离散型随机变量以及关于它们的一些性质.对于概率论与数理统计方面的计算及可视化,主要的Python包有scipy, numpy和matplotlib等. 以下所有Python代码示例,均默认已经导入上面的这几个包,导入代码如下: import numpy as np from scipy import stats import matplotlib.pyplot as plt 0.  Python中调用一个分布函数的步骤 scipy是Pytho

推荐系统中所需的概率论与数理统计知识

前言 一个月余前,在微博上感慨道,不知日后是否有无机会搞DM,微博上的朋友只看不发的围脖评论道:算法研究领域,那里要的是数学,你可以深入学习数学,将算法普及当兴趣.想想,甚合我意.自此,便从rickjin写的"正态分布的前世今生"开始研习数学. 如之前微博上所说,"今年5月接触DM,循序学习决策树.贝叶斯,SVM.KNN,感数学功底不足,遂补数学,从'正态分布的前后今生'中感到数学史有趣,故买本微积分概念发展史读,在叹服前人伟大的创造之余,感微积分概念模糊,复习高等数学上册,

概率论与数理统计复习

概率论与数理统计复习            第一章  概率论的基本概念 一.基本概念 随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E的所有可能结果组成的集合.  样本点(基本事件):E的每个结果. 随机事件(事件):样本空间S的子集. 必然事件(S):每次试验中一定发生的事件. 不可能事件(F):每次试验中一定不会发生的事件. 二. 事件间的关系和运算 1.AB

机器学习之微积分与概率论入门1

这两门学科作为机器学习的必备科目! 一.微积分1夹逼定理通俗的讲:A≤B≤C当求极限时,存在A=C,则说明B也等于A和C案例1: 案例2: 2 两个重要极限 3 导数通俗的讲就是曲线的斜率二阶导数是斜率变化快慢的反应,表征曲线的凹凸性常用的函数的导数 案例1:求幂指函数的套路 ===重要公式之,泰勒公式:简单应用: 4 方向导数和梯度函数(1)方向导数:如果函数z=f(x,y)在点P(x,y)是可微分的,那么,函数在该点沿任一方向L的方向导数都存在,且有:其中,ψ为x轴到方向L的转角 (2)梯度

【Q&A】12C OCP 1z0-060 QUESTION 1: About Managing Temporary Tablespaces in a CDB

QUESTION 1 Your multitenant container (CDB) contains two pluggable databases (PDB), HR_PDB and ACCOUNTS_PDB, both of which use the CDB tablespace. The temp file is called temp01.tmp. A user issues a query on a table on one of the PDBs and receives th

$q服务的API详解

下面我们通过讲解$q的API让你更多的了解promise异步编程模式.$q是做为angularjs的一个服务而存在的,只是对promise异步编程模式的一个简化实现版,源码中剔除注释实现代码也就二百多行,下面开始介绍$q的API. defer对象(延迟对象)可以通$q.defer()获取,下面是defer对象的api:  方法: resolve(value):向promise对象异步执行体发送消息告诉他我已经成功完成任务,value即为发送的消息. reject(value): 向promise

angularjs $q、$http 处理多个异步请求

在实际业务中经常需要等待几个请求完成后再进行下一步操作.但angularjs中$http不支持同步的请求. 解决方法一: $http.get('url1').success(function (d1) { $http.get('url2').success(function (d2) { //处理逻辑 }); }); 解决方法二: then中的方法会按顺序执行. var app = angular.module('app',[]); app.controller('promiseControl'

【概率论与数理统计】小结2 - 随机变量概述

注:对随机变量及其取值规律的研究是概率论的核心内容.在上一个小结中,总结了随机变量的概念以及随机变量与事件的联系.这个小结会更加深入的讨论随机变量. 随机变量与事件 随机变量的本质是一种函数(映射关系),在古典概率模型中,“事件和事件的概率”是核心概念:但是在现代概率论中,“随机变量及其取值规律”是核心概念. 随机变量与事件的联系与区别 小结1中对这两个概念的联系进行了非常详细的描述.随机变量实际上只是事件的另一种表达方式,这种表达方式更加形式化和符号化,也更加便于理解以及进行逻辑运算.不同的事