为了描述一组数据的均值,我们引入了数学期望的概念,为了描述一组数据相对均值的波动情况,我们引入了方差。 能够看到,方差的本质也是一个期望,那么我们就能够利用期望的定义将其继续展开。 方差的一条重要性质: 时间: 2024-10-20 16:07:39
wiki上的解释很好,自己组织语言也不见得比wiki上的好.所以摘录如下(红色字体是特别标注的部分): 方差:http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE 方差 变异量(数)(Variance),应用数学里的专有名词.在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离.一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量.方差的算术平方根称为该随机变量的标准差. 标准差才是变量离其期望值
这是我在上模式识别课程时的内容,也有参考这里. 线性判别函数的基本概念 判别函数为线性的情况的一般表达式 式中x是d 维特征向量,又称样本向量, 称为权向量, 分别表示为 是个常数,称为阈值权. 设样本d维特征空间中描述,则两类别问题中线性判别函数的一般形式可表示成 (3-1) 其中 而ω0是一个常数,称为阈值权.相应的决策规则可表示成, g(X)=0就是相应的决策面方程,在线性判别函数条件下它对应d维空间的一个超平面, (3-3) 为了说明向量W的意义,我们假设在该决策平面上有两个特征向量
超几何分布: 超几何分布基于这样一个模型,一个坛子中有N个球,其中m个白球,N-m个黑球,从中随机取n(不放回),令X表示取出来的白球数,那么: 我们称随机变量X满足参数为(n,m,M)的超几何分布. 考察其期望的求法: 几何分布: 在独立重复实验当中,每一次实验成功的概率是p,我们关注使得实验成功一次所需要重复的实验次数n及其对应的概率,很容易看到,我们有如下的分布列: 验证其作为分布列的性质: 几何分布的期望: 根据期望的定义,并在这里设q = 1-p 二项分布: 基于最基础的一个离散型随机
超几何分布: 超几何分布基于这样一个模型,一个坛子中有N个球,其中m个白球,N-m个黑球,从中随机取n(不放回),令X表示取出来的白球数,那么: 我们称随机变量X满足参数为(n,m,M)的超几何分布. 考察其期望的求法:
基于对概率问题的工具化表征如随机变量.分布列等概念,我们可以开始讨论各种各样的分布列了.(这一章节在书中叫做“随机变量”,但是为了和第五章“连续随机变量”区分开,这里标题写成“离散型随机变量”) 从二项分布结合级数推导而来的泊松分布: 对于二项分布我们很熟悉,在生活当中我们也很常用,但是其计算公式不免显得有点繁琐,我们现进行如下的简化推导: 设某个二项分布的参数是(n,p),设置参数λ=np.随机变量为X. 同时结合几种极限求法,我们能够看到,当n趋近于无穷的时候,有: 因此我们得到: 这便是泊
在讨论连续型随机变量函数的分布时,我们从一般的情况中(讨论正态分布的文章中提及),能够得到简化版模型. 回忆利用分布函数和概率密度的关系求解随机变量函数分布的过程,有Y=g(x),如果g(x)是严格单调的,那么在我们就能够利用反函数直接得到X的范围(如果不是单调的,需要考虑的事情就要多一点),由此将Y的分布函数和X的分布函数建立了联系,定理的具体形式如下:
基于我们最为熟悉的离散型分布——二项分布,我们能够衍生出很多别的分布列,对于之前介绍过的几何分布,我们赋予其的含义是:某个事件成功的概率是p,在n次独立重复实验中恰好成功一次的概率是多少.顺着这层含义,我们把1次编程r次,便得到了所谓的负二项分布.设负二项分布的随机变量是X,独立事件成功的概率是p,则在n次重复独立实验中恰好成功r次的概率是: 较之二项分布,我们能够看到,负二项分布更加强调n次重复实验中“恰好”成功r次,也就是要求第n次实验恰好是第r次成功的实验. 我们通过一个问题来进行举例——
在利用基本的概率论模型解决实际问题的时候,我们很容易发现一些随机变量的连续分布的,例如火车进站的时间.台灯的寿命等一些和时间相关的随机变量,此时我们发现我们难以求出某个点的概率了,因为随机变量是连续的,基本事件空间是一个无穷的空间,而与无限.连续这些字眼相关,很自然的想到,这里我们要借助积分的工具. 现在我们面临的问题是,如何用上积分这个工具呢?我们假想一条曲线f(x)和连续随机变量的取值区间[a,b]围成了一个面积为1的曲边梯形,(之所以控制面积为1,是为了满足分布列的基本性质),那么对于P(
在关于离散型随机变量函数的期望的讨论中,我们很容易就得到了如下的等式: 那么推广到连续型随机变量,是否也存在类似的规律呢? 即对于连续型随机变量函数的期望,有: 这里给出一个局部的证明过程,完整的证明过程书中留在了理论习题当中.
二项分布: 基于最基础的一个离散型随机变量——伯努利随机变量X,我们进行n次重复的实验,其概率分布结果就是所谓的二项分布. 具体点来说,就是某个实验成功的概率是p,现在我们进行n此时杨,设随机变量X表示n次实验后成功的次数,那么有如下分布列成立. 关于其期望,推导过程和几何分布.超几何分布中期望的推导是同质的,先退出X^k的表达式,然后根据二项式恒等关系,寻求自相似性建立递推关系,然后得到最终的期望值,由于之前已经给出了详细的推导过程,这里就不再赘述感兴趣的读者可以手动推导一下. 最后会得到这样