统计分析基础 (二) 概率事件关系与计算

统计分析基础 (二)概率事件关系与计算

1概率基础知识

1.1 概率

概率,又称或然率、机会率、机率(几率)或可能性,它是概率论的基本概念。事件的概率是衡量该事件发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。

1.2 随机试验

试验:对某种自然现象作一次观察或进行一次科学试验。例如:

:抛一枚硬币,观察正面H、反面T出现的情况。

:将一枚硬币抛掷三次,观察正出现的次数。

:抛一颗骰子,观察出现的点数。

:记录某城市120急救电话台一昼夜接到的呼唤次数。

:在一批灯泡中任意抽取一只,测试它的寿命。

:记录某一昼夜的最高温度和最低温度。

上面的试验,具有以下特点:

1、可以在相同的条件下重复进行。

2、试验的可能结果不止一个,但在试验前可以知道所有可能结果。

3、试验前不能确定哪个结果会出现。

拥有以上3个特点的试验称为“随机试验”

1.3 样本空间

对于随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S。其中,S中的元素,即E的每个可能结果,称为样本点。

1、实例:抛一枚硬币,观察正面H、反面T出现的情况:

 =

H:字面朝上

T:花面朝上

2、实例:抛一颗骰子,观察出现的点数:

 =

3、实例:记录某地铁站某日上行等车时刻:

 = 

4、实例:记录某一昼夜的最高温度和最低温度

 =其中为平均温度。

5、实例:从一批灯泡中任取一只,测试其寿命

 = 其中为灯泡的寿命。

1.4 事件

事件:我们称试验E的样本空间S的某个子集为E的随机事件,简称事件。一般用大写字母A,B,C...表示。

基本事件:由一个样本点组成的单点集,称为基本事件。抛骰子中,骰子一共有6个基本事件。

事件发生:在每次试验中,当事件中的某个样本点出现时,称这个事件发生。抛骰子中,如果抛得点数为4点,那么我们可以称事件A发生。

必然事件:在每个试验中一定会发生的事件。抛骰子中,事件D:“点数小于等于6点”是必然事件。

不可能事件:在每个试验中一定不会发生的事件,用?表示。抛骰子中,事件E:“点数大于6点”是不可能事件。

1.5 事件关系

事件是一集合,因而事件间的关系与事件的运算自然按照集合论中的集合之间的关系和集合运算来处理。

1、图1-1:包含关系,A?B事件B包含事件A,A事件的发生必导致事件B发生。即,如果A?
B且B?A则称A事件与B事件相等。

2、图1-2:和事件,A∪B事件A事件发生或者B事件发生,至少有一个事件发生。则称此事件为事件A与事件B的和事件记作A∪B(或A+B)。

3、图1-3:积事件,A∩B且仅当事件A,B同时发生时,事件A∩B发生。A∩B也记作AB。

4、图1-4:差事件,当A事件发生、B事件不发生事件A–B发生。

5、图1-5:互斥事件,A事件不 能B事件同时发生,基本事件是两两互不相容的。事件为:A∩B=
?

6、图1-6:逆事件,每次试验中,事件A、B必有一个发生,且仅有一个发生,A的逆事件记为B∪
=S,B∩=?

1.6 关系定律

1、交换律:A∪B
= B ∪A;A∩B = B∩
A

2、结合律:A∪(B∪C)
= (A∪B)∪C;A∩(B∩C)
= (A∩B)∩C

3、分配律:A∪(B∩C)
= (A∪B)∩(A∪C)

A∪(B∩C)是黄色+蓝色   
(A∪B)是黄色+蓝色+绿色  
(A∪C)是黄色+蓝色+红色

4、分配律:A∩(B∪C)
= (A∩B)∪(A∩C)

A∩(B∪C)是黄色                                    
 (A∩B)是蓝色+黄色;(A∩C)是绿色+黄色;

5、德摩根律
=

左图:黄色部分表示:除AB区域以外的黄色区域

右图:黄色部分表示:除AB积区域外的黄色区域,即:黄色+绿部分表示(A逆事件),黄色+蓝色部分表示(A逆事件)

1.7 事件运算

1、例1:抛硬币:

:中事件:“第一次出现的是H”,即
= { HHH, HHT, HTH,HTT }

事件:“三次出现相同的一面”,即:
= { HHH, TTT }

:中事件:“寿命小于1000小时”,即:
={ t |
1000
}

:事件:“最高温度与最低温度相差10摄氏度”,即:
={ (x.y)| y – x =10,≤x≤
y ≤ 

}

2、例2:事件运算:

=
{ HHH, HHT, HTH, HTT, TTT }             #的和事件,两个并集


= { HHH }                       #的积事件,两个交集

-
= { TTT }                       #的差事件,两个差集

 = {THT, TTH,THH}               
  #的逆事件,即不在集合且也不在集合

1.8 频率

1、在相同的条件下,重复n次试验,事件A发生的次数称为A发生的频数,称为事件A发生的频率。

从抛硬币的多次试验结果可以看出,当试验重复次数较少时,事件H(正面向上)发生的频率在0到1之间随机浮动。但是,当试验重复次数较多时,事件H发生的频率却围绕着0.5上下波动,并逐步地稳定于0.5。

2、实验总结:

大量的试验证明,当试验的重复次数n逐渐增大时,事件A发生的频率会逐渐稳定于某个常数P。这个P就是事件A发生的概率,用于表示在一次试验中,事件A发生的可能性大小。记事件A的概率为P(A)

3、概率需要满足的条件:

1. 非负性:P(A)≥ 0

2. 规范性:对于必然事件S,有P(S) = 1

3. 可列可加性:对于两两互不相容的事件
,
,
……即?
=? ,i≠ j,i,j
=1,2……,有P(∪……)
= P()+
P()+
……

如:抛3次硬币中:事件A:“正面向上次数是1”,事件B:“正面向上次数是2”,事件C:“正面向上次数是3”, 事件D:“正面向上次数至少是1”。

D = A∪B∪C,且A,B,C互不相容,则P(D)=
P(A∪B∪C)= P(A)+ P(B)+
P(C)

4、性质:

1. P(?)
= 0,不可能发生的概率,即为:0

2. 对于两两互不相容的事件
,
,,
…… 即?
= ? ,i≠ j,i,j
=1,2……,有P(∪……)
= P()+
P()+
…… + P()

3. 对于A,B两个事件,若A?
B,则P(A -B) = P(A) - P(B);

4. 对于任一事件A,有P(A)
1

5. 对于任一事件A,有P(A)=
1 – P(A)

6. 对于任一事件,有P(A∪B)=P(A)+P(B)-P(AB)(称为加法公式)
#概率P被加了两次,因此需要减去一次

推广:

P()
= P()+P()+P()–P()–P()–P()+P()

7. 例:某公司随机抽取员工,已知抽取一名女员工的概率为0.5,抽取到24~34岁之间的员工概率为0.3,抽取到24~34岁之间的女员工0.2,那么抽取到一名抽取到24~34岁之间员工,或者24~34岁之间员工女员工的概率是多少?

解:使用公式:P(A∪B)
= P(A) + P(B) - P(AB),

记事件A = {抽取一名女员工},事件B
= { 抽取到24~34岁之间的员工},

则P(A) = 0.5,P(B)
= 0.3,则P(AB) = 0.2         #AB的积事件

根据工式:P(A∪B)=P(A)+P(B)-P(AB)=
0.5+0.3-0.2 =0.6

--以上为《统计分析基础 (二) 概率事件关系与计算》,如有不当之处请指出,我后续逐步完善更正,大家共同提高。谢谢大家对我的关注。

——厚积薄发(yuanxw)

时间: 2024-08-09 08:29:28

统计分析基础 (二) 概率事件关系与计算的相关文章

Scala 中的函数式编程基础(二)

主要来自 Scala 语言发明人 Martin Odersky 教授的 Coursera 课程 <Functional Programming Principles in Scala>. 2. Higher Order Functions 把其他函数作为参数或者作为返回值,就是 higher order functions,python 里面也可以看到这样使用的情形.在酷壳上的博客有一个例子就是将函数作为返回值. 2.1 匿名函数 在 python 里边叫 lambda 函数,常常与 map(

Python全栈开发【基础二】

Python全栈开发[基础二] 本节内容: Python 运算符(算术运算.比较运算.赋值运算.逻辑运算.成员运算) 基本数据类型(数字.布尔值.字符串.列表.元组.字典) 编码与进制转换 Python 运算符 1.算术运算: 2.比较运算: 3.赋值运算: 4.逻辑运算:  5.成员运算: 基本数据类型 1.数字 int(整型) 1 class int(object): 2 """ 3 int(x=0) -> integer 4 int(x, base=10) -&g

Object Pascal 语法之语言基础(二)

1.5 数据类型与定义变量 Object Pascal 语言的最大特点是对数据类型的要求非常严谨.传递给过程或函数的参数值必须与形参的类型一致.在Object Pascal 语言中不会看到像C 语言编译器提示的“可疑的指针转换”等警告信息.由于Object Pascal 语言对数据类型比较严谨,因此它会对代码进行严格检查,以确保不会出现错误.变量是程序代码中代表一个内存地址的标识符,那么该地址的内存内容就可以在程序代码执行时被改变.每个变量都有一个名字和数据类型,名字可以用来引用变量,数据类型决

统计分析基础 (一) 数据统计与图表

统计分析基础 (一)数据统计与图表 1 数据统计 1.1 统计学 统计学是在数据分析的基础上,自17世纪中叶产生并逐步发展起来的一门学科.它是研究如何测定.收集.整理.归纳和分析反映数据,以便给出正确消息的科学.统计广泛地应用在各门学科,从自然科学.社会科学到人文学科,甚至被用来工商业及政府的情报决策之上,目前比较热门的应用:经济学,医学,心理学等.随着大数据(Big Data)时代来临,统计的面貌也逐渐改变,与信息.计算等领域密切结合,是数据科学(Data Science)中的重要主轴之一.

Python基础二:pycharm的安装及简单使用,while循环,格式化输出,运算符, 编码的初识,git

Python基础二: pycharm的安装及简单使用,while循环,格式化输出,运算符, 编码的初识,git 1.pycharm的安装及简单使用 Tab / Shift + Tab 缩进.不缩进当前行 (先选中代码) Shift + 滚轮 放大缩小代码 Ctrl + ? 注释.解注(先选中代码) Ctrl + d 复制上一行代码 Ctrl + z 撤销 Ctrl + Shift + F10 RUN Ctrl + 左键---->点击 int,str 等可查看源码 2.while 循环(重点) w

《利用Python进行数据分析&#183;第2版》第四章 Numpy基础:数组和矢量计算

<利用Python进行数据分析·第2版>第四章 Numpy基础:数组和矢量计算 numpy高效处理大数组的数据原因: numpy是在一个连续的内存块中存储数据,独立于其他python内置对象.其C语言编写的算法库可以操作内存而不必进行其他工作.比起内置序列,使用的内存更少(即时间更快,空间更少) numpy可以在整个数组上执行复杂的计算,而不需要借助python的for循环 4.0 前提知识 数据:结构化的数据代指所有的通用数据,如表格型,多维数组,关键列,时间序列等 相关包:numpy pa

Html5开发——html+css基础二(个人博客一)

今天没有写完,而且写的还有点问题,所以今天就先不上传代码了(ps:快写完了才发现布局有问题,导致代码太多,感觉写的不是很好,所以今天先分析一下布局) 第一步先写一个大的div用来放ABC三个部分,这个大的div居中! 第二步分别写ABC三个部分,ABC三个部分分别使用浮动(float)来定位.A和B都各使用了一张非常小的图片,通过重复(repeat)属性生成A和B 第三步C部分分别写好3~16这几个模块,在通过组合利用浮动定位.分组如下: E:3 F:4.7.10.13 G:5.8.11.14

R语言基础(二) 可视化基础

> which.max(apply(x[c("x1","x2","x3")], 1, sum))49 > x$num[which.max(apply(x[c("x1","x2","x3")], 1, sum))][1] 2005138149 > hist(x$x1) > plot(x$x1,x$x2) > table(x$x1) 80 81 82 83 84

Bootstrap &lt;基础二十五&gt;警告(Alerts)

警告(Alerts)以及 Bootstrap 所提供的用于警告的 class.警告(Alerts)向用户提供了一种定义消息样式的方式.它们为典型的用户操作提供了上下文信息反馈. 您可以为警告框添加一个可选的关闭按钮.为了创建一个内联的可取消的警告框,请使用 警告(Alerts) jQuery 插件. 您可以通过创建一个 <div>,并向其添加一个 .alert class 和四个上下文 class(即 .alert-success..alert-info..alert-warning..ale