在高教社出版的中山大学统计科学系编写的《概率论与数理统计》一书的§1.3
概率模型与公理化结构一节中,为了建立概率论的公理化结构,首先定义了一个叫做“σ-代数”的东东。作为初学者,往往畏惧这些抽象概念却又避之不过,只得选择死记硬背,其实这样也无可厚非。只是当我们费劲脑汁终于记住了这些概念后,不妨想一想:前人是出于什么目的来定义这些概念的?真正理解了前人的用意以后,估计你就再也不会忘却这一概念了。
其实本书在这一节的最前面已经给出了定义“σ-代数”的原因,但似乎表述的不够清楚,下面给出我的理解,我们知道
联系与一个随机试验首先有一个样本空间Ω,它是由所有代表基本事件的样本点的全体组成。Ω的子集叫事件。人们总是希望通过简单的事件的概率来推算复合事件的概率,但
- 是否所有的基本事件都能算出它的概率?
- 当基本事件的概率已确定,是否任何Ω的子集(即“事件”)的概率都能确定?
如果样本空间只有有穷个样本点时,这两个问题答案是肯定的!但对于任意的样本空间却不一定。但事实上我们也不苛求这两个问题中的“所有”以及“任何”这样的字眼,只是对相当广泛的一类事件能算出它的概率就够了。
也就是说,对于任意的样本空间,我们现在想要建立“概率”这一数学概念,只要求其基于“相当广泛的一类事件(Ω的子集)”就行啦~那么很明显,我们首先要先规范“相当广泛的一类事件“这个定义,它也就是σ-代数啦!
至于σ-代数的数学定义,这里不再给出,请自行翻书。
定义了σ-代数之后,又定义了可测空间:
把任一样本空间Ω,以及由Ω的子集所组成的一个σ-代数f写在一起,记为(Ω,f),称为具有σ-代数结构的样本空间,简称为可测空间。
根据前面的介绍你应该知道为什么它叫【可测】空间了吧?因为对于f的任何子集(即事件),我们都能给出它的概率呗!(也就是前面提到的两个问题的初衷)。定义了可测空间以后就可以在其上定义概率了,书中写的很清楚不再赘述。
定义概率空间的顺序是:Ω是一样本空间-->f为Ω中的σ-代数-->P为f上的概率。我们称具有上述结构的样本空间为概率空间。记为(Ω,f,P)。