[补档计划] 概率论

4.1 事件与概率

  在一个黑箱中, 放着 3 个红球和 1 个白球. 我们从箱中取出一个球, 再放回去, 反复进行若干次. 每一次的结果是不确定的, 但总体上拿到红球的次数与拿到白球的次数接近 3 : 1 .

  我们发现, 这类现象很常见, 那么我们就要尝试把这类现象的特点进行概括, 命名, 然后研究它的性质, 进而应用它.

  概括一下这种现象: 在个别实验中其结果呈现出不确定性, 而在大量重复实验中其结果又具有统计规律性. 为了简便地称呼这种现象, 我们要给它起名字, 称之为 "随机现象" .

  怎么研究一种现象?

  "事实是检验真理的唯一方法." 我们要通过试验来检验真理.

  这种试验称为 "随机试验" , 要满足: ①可以反复进行 ②不确定性. 它产生的现象是 "随机现象" .

  

  为了刻画 "随机试验" , 我们需要定义一些相关的量.

  对于一个量的定义, 可以有多种方法: 文字语言, 数学语言, 图像语言, 自然语言等等. 在理解上, 可以举例子.

  

  随机试验会出现若干种结果, 某些结果有某些特性. 为了描述这种情形, 我们定义了以下. 样本空间 $U$ : 随机试验的所有结果的集合. 样本点: 一个结果. 事件: 一个子集. 事件"发生" 当且仅当 子集中的一个样本点出现. 基本事件: 单个样本点组成的集合.

  给出了一个定义之后, 我们还有研究一些特殊的情况, 以细化和完善对这个定义的理解. 必然事件, 不可能事件.  

  

  接下来, 应该把事件之间的运算关系先给弄清楚.

  事件的定义类比了集合的定义, 集合的运算律在事件中同样适用.

  我们定义了和事件, 积事件, 互斥事件与对立事件.

  和事件 $A+B$ , $A,B$ 中至少有一个事件发生.

  积事件 $AB$ , $A,B$ 同时发生.

  特殊地, 如果 $AB = \emptyset$ , 则称事件 $A$ , $B$ 互斥, 即 $A,B$ 不能同时发生.

  再特殊地, 如果 $A$ , $B$ 互斥, $A+B = U$ , 则称 $A$ , $B$ 为对立事件.

  随机试验出现每种结果的可能性不一样. 为了量化地描述这种可能性, 我们定义了频率 $\frac{N_A}{n} = \frac{出现次数}{实验次数}$ .

  当实验次数非常大的时候, 频率总是接近某个常数, 并在它的周围摆动, 这个常数就是事件 $A$ 的概率 $P(A)$ . 换句话说, 概率是通过频率的极限定义的.

  由此也知道, 概率的直观意义刻画了一个事件出现的可能性大小. 概率越大, 可能性越大.

  现在, 我们已经引入了两个概率论的核心概念: 事件 , 概率.

  接下来, 应该研究概率的性质.

  概率有一堆非常直观的性质.

  性质1: 非负性, $0\le P(A)\le 1$ .

  性质2: 规范性. $P(不可能事件) = 0, P(必然事件) = 1$ .

  性质3: 容斥性. $P(A+B) = P(A) + P(B) - P(AB)$ .

  性质4: 互斥事件可加性.

  性质5: 独立事件可乘性. $P(AB) = P(A)P(B)$ .

  能否掌握这些性质, 关键在于能不能应用, 至于过于哲学的问题暂时也没时间想了.

4.2 古典概率

  $P(A) = \frac{a}{a+b}$ .

时间: 2025-01-18 10:34:25

[补档计划] 概率论的相关文章

[补档计划] 类欧几里得算法

$$\begin{aligned} f(a, b, c, n) & = \sum_{i = 0}^n \lfloor \frac{ai + b}{c} \rfloor \\ & = \sum_{i = 0}^n \sum_{j = 0}^{m-1} [j < \lfloor \frac{ai + b}{c} \rfloor] \\ & = \sum_{i = 0}^n \sum_{j = 0}^{m-1} [j + 1 \le \lfloor \frac{ai + b}{c}

[补档计划] 字符串

学习一个算法, 需要弄清一些地方: ① 问题与算法的概念; ② 算法, 思维轨迹 ③ 实现, 思维轨迹; ④ 复杂度分析; ⑤ 应用. KMP算法 字符串匹配与KMP算法 为了方便弄清问题, 应该从特例入手. 设 A = " ababababb " , B = " ababa " , 我们要研究下面三个递进层次的字符串匹配问题: ① 是否存在 A 的子串等于 B ② 有几个 A 的子串等于 B ③ A 的哪些位置的子串等于 B KMP算法可以直接在线性复杂度解决问题

[补档计划] 树6 - 莫队算法

[CF633H] Fibonacci-ish II 题意 给定长度为 $N$ 个序列 $A = (a_1, a_2, ..., a_N)$ . $M$ 组询问 $(l, r)$ : 将 $a_l, a_{l+1}, ..., a_r$ 提取出来, 排序, 去重, 得到长度为 $K$ 的序列 $B = (b_1, b_2, ..., b_K)$ , 求 $\sum_{i = 1}^K f_ib_i$ . 其中 $f_i$ 为斐波那契数列的第 $i$ 项: $f_0 = f_1 = 1, f_i =

[补档计划] 覆盖子串与循环节

覆盖子串与循环节的概念 首先还是给覆盖子串和循环节下个定义. 为了方便后面的描述, 我们定义布尔记号 $P_S^T$ , 表示 $T$ 是否为 $S$ 的前缀. 对于一个定义, 为了对它有足够充分的了解, 可以通过多种形式描述这个定义, 这里就再引用图像的方法吧. 再引入前缀记号和后缀记号 pre[i] = S[1 : i], suf[i] = S[1 : |S|]. 对于字符串 S , 若字符串 T , 满足 $P_S^T$ , 且 $\exists k,~P_{kT}^S$ , 则称 T 为

[补档计划] 树4 - 线段树

[CF787D] Legacy 题意 $N$ 个点, $M$ 条连边操作: $1~u~v~w~:~u\rightarrow v$ . $2~u~l~r~w~:~u\rightarrow [l, r]$ $3~u~l~r~w~:~[l, r]\rightarrow u$ . 给定点 $s$ , 求单源最短路. $N\le 10^5$ . 分析 考虑使用 线段树结构 优化 建图. 建立一棵线段树, 每个点表示一个区间. 拆点, 线段树的每个点拆成 入点 和 出点 . 出线段树 的儿子连父亲, 因为可

[补档计划] 树2 - 树上倍增

[SCOI2016] 萌萌哒 题意 求有多少个无前导零的 $N(N\le 10^5)$ 位数 $A$ , 满足 $M(M\le 10^5)$ 个限制条件 $L~R~X~Y$ : $A[L+i] = A[X+i]$ . 分析 区间的信息就先对 ST 表用并查集, 然后下传. 实现 #include <cstdio> #include <cstring> #include <cstdlib> #include <cctype> #include <cmat

[补档计划] 动态规划3 - 树形DP

树形DP 是一类 OI 中的问题, 即对一棵树进行 DP . 很多时候要进行两次 DP , 第一次处理子树内的情况, 第二次处理所有的情况. 关键靠做题. [CF697D] Puzzles 题意 给定一棵 $N$ 个节点的树. 求进行 DFS , 每个节点的时间戳的期望值. 分析 树的遍历 & 特性分析 进行 DFS , 根的时间戳一定是 1 . $f[1] = 1$ . $f[next] = f[x] + \sum_{i = 1} ^ c \frac{1}{c} \sum_{son \ne n

[补档计划] SAM

对于一个算法或者数据结构的学习, 我们首先要弄清它的概念, 然后理解它的构建, 进而是实现和复杂度分析, 最后考虑如何应用它. 现在学习的是 SAM, Suffix Automaton, 后缀自动机. 推荐陈立杰的冬令营讲稿. https://wenku.baidu.com/view/90f22eec551810a6f4248606.html 什么是自动机? 有限状态自动机的功能是识别字符串. 令一个自动机 $A$ , 若 $A$ 能识别字符串 $S$ , 则 $A(S) = True$ ; 若

[补档计划] 后缀数组

后缀数组的实现 对于一个字符串 S , 有后缀数组 sa[1..n] , 排名数组 rk[1..n], 和辅助数组 height[1..n]. sa[i]: 在 S 的后缀中, 排名第 i 的后缀为 S[sa[i]: n] . rk[i]: 在 S 的后缀中, S[i:n] 的排名. height[i]: S[sa[i-1]:n] 与 S[sa[i]:n] 的 LCP. 显然有 rk[sa[i]] = i, sa[rk[i]] = i. 使用倍增的方法快速求 sa[1..n] 和 rk[1..n