对于确定的量,比如一个班上的人数,桌子上面有5个苹果之类的。都是比较确定的事情,是已经存在的。概率所研究的是不确定性量和不可准测量,不确定量代表的是没有发生的事情,及随机事件(严格来讲,概率研究的是不确定性中的一种,即在一定结果范围内的不确定性)。而不可准测量代表的是虽然量有准确值,但由于技术或者操作因素,无法测得其真实值,比如一支笔的长度,理论上你是不可能测得其真实值的。总结起来有以下三种情况:
1)抛硬币所代表的随机试验。
2)样本与总体之间的问题
3)近似值与真实值
当然,在现实中,以上3类问题中还常常交织在一起。
对于第1类问题,确定了一种关系,就是频率与概率的关系。本质上也是一种测量问题,因为频率是容易求得的,而真实的概率(真实值)不容易获得。但在实际中应用中,我们经常利用频率替代概率。但从逻辑上来说,这显然是不够严谨的,似乎缺少必要的公理。而强大数定理就是用来解决这个问题的。在随机试验次数n趋于无穷大时,频率稳定于概率。当然实际应用中,n并不需要真趋于无穷大。
对于第2类问题反映的是在无法对总体进行研究的情况下(比如总体是无限的,而人类的能力和精力都是有限的,或者太多,测量成本上不划算等),我们只能取其中一部分(样本)来做研究,通过对样本的研究达到对总体的研究。这就产生了一个问题,就是通过对样本的研究能不能替代对整体的研究。答案当然是大多数情况下都是可以的,因为我们经常这么做。不过从科学的严谨上来说,我们还是需要能证明这种方式是可以的。而极限定理就是这种研究行为的理论基础。当然,需要说明的是,不是所有的样本都能替代总体进行研究的。极限定理的两个基本条件是:独立,随机。这其实就提出了为研究总体而取样本的方式是有条件的。
对于第3类问题,反映的是既然真实值没法获得,那就用近似值替代,特别是多次测量的平均值替代。这也是我们经常干的事情,多测几次,取个平均值,就代替真实值。这又不可避免的产生了一个问题,这个平均值毕竟只是个近似值,能代替真实值做一些事情么?说不行肯定不行了。这个问题同样依赖于极限定理。虽然用测量平均值替代真实值有了理论基础,但需要特别注意的是,测量误差必须是随机的,非故意的。这个假设非常重要,如果你的测量不满足这种情况,极限定理是不会为你支撑的。
这些看似无法证明的东西,哪些“家”都能搞出定理来证明,也确实只能佩服。不过想想也是,虽然概率研究的是不确定性,但毕竟这种不确定性是有规律的,至少其结果范围是知道的。如果什么都不知道呢?
记:这段时间看书任务量非常大,所以写得比较少。等知识重构完成后,会继续分享心得。
??