统计分析基础 (二)概率事件关系与计算
1概率基础知识
1.1 概率
概率,又称或然率、机会率、机率(几率)或可能性,它是概率论的基本概念。事件的概率是衡量该事件发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。
1.2 随机试验
试验:对某种自然现象作一次观察或进行一次科学试验。例如:
:抛一枚硬币,观察正面H、反面T出现的情况。
:将一枚硬币抛掷三次,观察正出现的次数。
:抛一颗骰子,观察出现的点数。
:记录某城市120急救电话台一昼夜接到的呼唤次数。
:在一批灯泡中任意抽取一只,测试它的寿命。
:记录某一昼夜的最高温度和最低温度。
上面的试验,具有以下特点:
1、可以在相同的条件下重复进行。
2、试验的可能结果不止一个,但在试验前可以知道所有可能结果。
3、试验前不能确定哪个结果会出现。
拥有以上3个特点的试验称为“随机试验”
1.3 样本空间
对于随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S。其中,S中的元素,即E的每个可能结果,称为样本点。
1、实例:抛一枚硬币,观察正面H、反面T出现的情况:
=
H:字面朝上
T:花面朝上
2、实例:抛一颗骰子,观察出现的点数:
=
3、实例:记录某地铁站某日上行等车时刻:
=
4、实例:记录某一昼夜的最高温度和最低温度
=其中为平均温度。
5、实例:从一批灯泡中任取一只,测试其寿命
= 其中为灯泡的寿命。
1.4 事件
事件:我们称试验E的样本空间S的某个子集为E的随机事件,简称事件。一般用大写字母A,B,C...表示。
基本事件:由一个样本点组成的单点集,称为基本事件。抛骰子中,骰子一共有6个基本事件。
事件发生:在每次试验中,当事件中的某个样本点出现时,称这个事件发生。抛骰子中,如果抛得点数为4点,那么我们可以称事件A发生。
必然事件:在每个试验中一定会发生的事件。抛骰子中,事件D:“点数小于等于6点”是必然事件。
不可能事件:在每个试验中一定不会发生的事件,用?表示。抛骰子中,事件E:“点数大于6点”是不可能事件。
1.5 事件关系
事件是一集合,因而事件间的关系与事件的运算自然按照集合论中的集合之间的关系和集合运算来处理。
1、图1-1:包含关系,A?B事件B包含事件A,A事件的发生必导致事件B发生。即,如果A?
B且B?A则称A事件与B事件相等。
2、图1-2:和事件,A∪B事件A事件发生或者B事件发生,至少有一个事件发生。则称此事件为事件A与事件B的和事件记作A∪B(或A+B)。
3、图1-3:积事件,A∩B且仅当事件A,B同时发生时,事件A∩B发生。A∩B也记作AB。
4、图1-4:差事件,当A事件发生、B事件不发生事件A–B发生。
5、图1-5:互斥事件,A事件不 能B事件同时发生,基本事件是两两互不相容的。事件为:A∩B=
?
6、图1-6:逆事件,每次试验中,事件A、B必有一个发生,且仅有一个发生,A的逆事件记为B∪
=S,B∩=?
1.6 关系定律
1、交换律:A∪B
= B ∪A;A∩B = B∩
A
2、结合律:A∪(B∪C)
= (A∪B)∪C;A∩(B∩C)
= (A∩B)∩C
3、分配律:A∪(B∩C)
= (A∪B)∩(A∪C)
A∪(B∩C)是黄色+蓝色
(A∪B)是黄色+蓝色+绿色
(A∪C)是黄色+蓝色+红色
4、分配律:A∩(B∪C)
= (A∩B)∪(A∩C)
A∩(B∪C)是黄色
(A∩B)是蓝色+黄色;(A∩C)是绿色+黄色;
5、德摩根律:
=
左图:黄色部分表示:除AB区域以外的黄色区域
右图:黄色部分表示:除AB积区域外的黄色区域,即:黄色+绿部分表示(A逆事件),黄色+蓝色部分表示(A逆事件)
1.7 事件运算
1、例1:抛硬币:
在:中事件:“第一次出现的是H”,即
= { HHH, HHT, HTH,HTT }
事件:“三次出现相同的一面”,即:
= { HHH, TTT }
在:中事件:“寿命小于1000小时”,即:
={ t | ≤
t 1000
}
在:事件:“最高温度与最低温度相差10摄氏度”,即:
={ (x.y)| y – x =10,≤x≤
y ≤
}
2、例2:事件运算:
∪=
{ HHH, HHT, HTH, HTT, TTT } #和的和事件,两个并集
∩
= { HHH } #和的积事件,两个交集
-
= { TTT } #和的差事件,两个差集
= {THT, TTH,THH}
#和的逆事件,即不在集合且也不在集合
1.8 频率
1、在相同的条件下,重复n次试验,事件A发生的次数称为A发生的频数,称为事件A发生的频率。
从抛硬币的多次试验结果可以看出,当试验重复次数较少时,事件H(正面向上)发生的频率在0到1之间随机浮动。但是,当试验重复次数较多时,事件H发生的频率却围绕着0.5上下波动,并逐步地稳定于0.5。
2、实验总结:
大量的试验证明,当试验的重复次数n逐渐增大时,事件A发生的频率会逐渐稳定于某个常数P。这个P就是事件A发生的概率,用于表示在一次试验中,事件A发生的可能性大小。记事件A的概率为P(A)
3、概率需要满足的条件:
1. 非负性:P(A)≥ 0
2. 规范性:对于必然事件S,有P(S) = 1
3. 可列可加性:对于两两互不相容的事件
,
,
……即?
=? ,i≠ j,i,j
=1,2……,有P(∪∪……)
= P()+
P()+
……
如:抛3次硬币中:事件A:“正面向上次数是1”,事件B:“正面向上次数是2”,事件C:“正面向上次数是3”, 事件D:“正面向上次数至少是1”。
D = A∪B∪C,且A,B,C互不相容,则P(D)=
P(A∪B∪C)= P(A)+ P(B)+
P(C)
4、性质:
1. P(?)
= 0,不可能发生的概率,即为:0
2. 对于两两互不相容的事件
,
,,
…… 即?
= ? ,i≠ j,i,j
=1,2……,有P(∪∪……)
= P()+
P()+
…… + P()
3. 对于A,B两个事件,若A?
B,则P(A -B) = P(A) - P(B);
4. 对于任一事件A,有P(A)≤
1
5. 对于任一事件A,有P(A)=
1 – P(A)
6. 对于任一事件,有P(A∪B)=P(A)+P(B)-P(AB)(称为加法公式)
#概率P被加了两次,因此需要减去一次
推广:
P(∪∪)
= P()+P()+P()–P()–P(∪)–P(∪)+P()
7. 例:某公司随机抽取员工,已知抽取一名女员工的概率为0.5,抽取到24~34岁之间的员工概率为0.3,抽取到24~34岁之间的女员工0.2,那么抽取到一名抽取到24~34岁之间员工,或者24~34岁之间员工女员工的概率是多少?
解:使用公式:P(A∪B)
= P(A) + P(B) - P(AB),
记事件A = {抽取一名女员工},事件B
= { 抽取到24~34岁之间的员工},
则P(A) = 0.5,P(B)
= 0.3,则P(AB) = 0.2 #AB的积事件
根据工式:P(A∪B)=P(A)+P(B)-P(AB)=
0.5+0.3-0.2 =0.6
--以上为《统计分析基础 (二) 概率事件关系与计算》,如有不当之处请指出,我后续逐步完善更正,大家共同提高。谢谢大家对我的关注。
——厚积薄发(yuanxw)