阮老师谈泊松分布

泊松分布与美国枪击案

作者: 阮一峰

日期: 2013年1月 8日

去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡。

资料显示,1982年至2012年,美国共发生62起(大规模)枪击案。其中,2012年发生了7起,是次数最多的一年。

去年有这么多枪击案,这是巧合,还是表明美国治安恶化了?

前几天,我看到一篇很有趣的文章,使用"泊松分布"(Poisson distribution),判断同一年发生7起枪击案是否巧合。

让我们先通过一个例子,了解什么是"泊松分布"。

已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?

假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:

(1)顾客购买水果罐头是小概率事件。

(2)购买水果罐头的顾客是独立的,不会互相影响。

(3)顾客购买水果罐头的概率是稳定的。

在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。

泊松分布的公式如下:

各个参数的含义:

P:每周销售k个罐头的概率。

X:水果罐头的销售变量。

k:X的取值(0,1,2,3...)。

λ:每周水果罐头的平均销售量,是一个常数,本题为2。

根据公式,计算得到每周销量的分布:

从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。

现在,我们再回过头,来看美国枪击案。

假定它们满足"泊松分布"的三个条件:

(1)枪击案是小概率事件。

(2)枪击案是独立的,不会互相影响。

(3)枪击案的发生概率是稳定的。

显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。

根据资料,1982--2012年枪击案的分布情况如下:

计算得到,平均每年发生2起枪击案,所以 λ = 2 。

上图中,蓝色的条形柱是实际的观察值,红色的虚线是理论的预期值。可以看到,观察值与期望值还是相当接近的。

我们用"卡方检验"(chi-square test),检验观察值与期望值之间是否存在显著差异。

卡方统计量 = Σ [ ( 观察值 - 期望值 ) ^ 2 / 期望值 ]

计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。

但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。

时间: 2024-08-07 08:21:51

阮老师谈泊松分布的相关文章

阮老师谈词条排序

基于用户投票的排名算法(一):Delicious和Hacker News 作者: 阮一峰 互联网的出现,意味着"信息大爆炸". 用户担心的,不再是信息太少,而是信息太多.如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题. 各种各样的排名算法,是目前过滤信息的主要手段之一.对信息进行排名,意味着将信息按照重要性依次排列,并且及时进行更新.排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位. 下面,我将整理和分析一些基

阮老师谈虚数

作者: 阮一峰 日期: 2012年9月24日 有人在Stack Exchange问了一个问题: "我一直觉得虚数(imaginary number)很难懂. 中学老师说,虚数就是-1的平方根. 可是,什么数的平方等于-1呢?计算器直接显示出错! 直到今天,我也没有搞懂.谁能解释,虚数到底是什么? 它有什么用?" 帖子的下面,很多人给出了自己的解释,还推荐了一篇非常棒的文章<虚数的图解>.我读后恍然大悟,醍醐灌顶,原来虚数这么简单,一点也不奇怪和难懂! 下面,我就用自己的语言

海外老师谈英语学习需要注意的几点

1.口语练习和其他的练习严重脱节 很多学生认为既然课程安排中把口语,听力,阅读和写作进行了分离,那么在学习某一门科目的时候就应该将所有的注意力集中到这一门科目上.其实这样做是不正确的. 其一,作为一个交流的工具,不论何时,英语的运用都要听说读写相结合才能发挥作用,记得某本杂志上曾经用大量的篇幅报道了一个在美国的留学生的故事,该名学生的读写能力可以说是出类拔萃,但在听和说方面的水平却还不如一个美国的10岁小孩子,结果在当地的生活根本无法正常进行.当然,这个例子比较极端,但从一个角度也说明了听说读写

马虹老师谈怎样练好“运手”一式

http://blog.sina.com.cn/s/blog_5fcde3320100ubja.html  在陈氏者架太极拳一路(83)式中,有两个式子(“倒卷肱”和“运手”)是比较难练.马虹先生在一次授课中说,我们这套拳,“运手”和“倒卷肱”一样,这两个式子是这套拳里比较难练的式子,难的是动作要保持左右.上下的协调,要保持手脚的配合(左手与左脚,右手与右脚),以及脚与脚的配合. 这个拳特别强调整体劲.一动无有不动,大小动作都要体现全身配合好动作,强调整体协调.我觉得越是较难的式子,越要仔细研究

我看朴灵评注阮一峰的《JavaScript 运行机制详解:再谈Event Loop》

阮一峰和朴灵对我来说都是大牛,他们俩的书我都买过,阮老师的译作<软件随想录>和朴灵的<深入浅出node.js>.这个事情已经过了4个月了,所以我拿来讲应该也没啥问题. 这件事情是这样的,阮一峰在自己的博客写了篇文章<JavaScript 运行机制详解:再谈Event Loop>,然后朴灵看见了,发现了很多问题,然后在印象笔记又写了篇文章<[朴灵评注]JavaScript 运行机制详解:再谈Event Loop>,由于印象笔记现在已经不能访问了(尼玛也太烂了)

【朴灵评注】JavaScript 运行机制详解:再谈Event Loop

PS: 我先旁观下大师们的讨论,得多看书了~ 别人说的:“看了一下不觉得评注对到哪里去,只有吹毛求疵之感. 比如同步异步介绍,本来就无大错:比如node图里面的OS operation,推敲一下就可以猜到那是指同步操作(自然不走event loop了):至于watcher啥的,显然只是实现上的特色,即使用同一个queue实现也未尝不可” [原帖: http://www.ruanyifeng.com/blog/2014/10/event-loop.html 作者:阮一峰] 一年前,我写了一篇<什么

js中的console对象(读书笔记-阮一峰的js标准参考教程)

阮老师的jstutorial:http://javascript.ruanyifeng.com/tool/console.html console对象是JavaScript中的原生对象.主要用于: 显示网页代码运行时的错误信息. 提供了一个命令行接口,用来与网页代码互动. 1.浏览器实现: Elements:用来调试网页的HTML源码和CSS代码. Resources:查看网页加载的各种资源文件(比如代码文件.字体文件.css文件等),以及在硬盘上创建的各种内容(比如本地缓存.Cookie.Lo

毛[文强]老师的一堂前端课程

对于像我们这样的后端程序员来说,前端似乎总是难于把握.可能并非因为难度,而是因为在前端的世界里,缺乏条理性和逻辑性.知识是分散的,工具是分散的,库是分散的.尤其像我这样的,没啥毅力的人,或者说想象力比较惨淡的人,前端进步不大. 好了,吐槽结束. -------------   毛老师 说话   -------------       几年前,还是痴迷java的那会儿,我也曾纠结于前端框架的选择.试图找出一套一劳永逸的前端框架继承到项目架构中.搜遍全网得出以下结论: 各大前端框架可以按照“封装度”

一个直肠癌患者的最后50天,转发自阮一峰博客

原文地址:http://www.ruanyifeng.com/blog/2008/12/final_50_days_of_a_rectal_cancer_patient.html 阮老师是我非常尊敬的人,很喜欢他的博客,曾经的某一天,我花了一整天浏览了阮老师从03年到18年15年的博客文章. 这里的一篇是我觉得可以在困难的时候看看的文章,因为现代社会生活便利,生病又少,大部分问题都能解决,导致我们的神经非常敏感,觉得失恋,失业这种小事都是大祸临头了.建议失意的朋友去菜市场或者医院看看,看看人间烟