第二章 随机变量及其分布

随机变量,顾名思义,就是具有随机性的变量。什么叫有随机性?中公考研辅导老师将带领大家从随机试验开始看起。

所谓随机试验,就是具有如下特征的试验:“可重复”,“结果不唯一”,“无法预知”(试验前无法预知哪种结果出现)。如掷硬币,掷骰子。对于某个随机试验,我们把其结果收集起来构成一个集合,这就构成了该试验的样本空间。而样本空间的子集就是随机事件。所以随机事件即某些试验结果构成的集合。概率第一章的基本概念:样本空间、随机事件、必然事件、不可能事件、基本事件,均可以理解成特殊的集合(由随机试验的结果构成的集合):全集、子集、全集、空集、单点集。

随机变量是定义在样本空间上的单值函数。例如对于掷硬币这个随机试验,其样本空间为{正,反},我们可以在这个样本空间上定义一个随机变量:X(正)=1,X(反)=0。

关于随机变量的概念,我们不妨多思考一下,以增进和它的关系。套用一句广告词:你怎么对待随机变量,随机变量就怎么对待你。请思考如下几个问题:

1. 随机变量是个函数,这个函数是不是高数中的函数?

不少同学没有思考过这个问题,那就错过了深入理解随机变量的机会。高数中的函数是什么样子的?起码定义域是实数集或实数集的子集。而随机变量的定义域是样本空间。这说明二者是不同类型的函数。什么?函数还有不同类型?有这种疑惑的同学很可能没有好好看教材,在同济六版高数教材第6页,有一小段话,较为透彻地解答了该问题。大家可以通过翻书或听我唠叨几句这两种方式解决这个问题。ready?go!映射是两个集合A,B之间的对应关系,考虑非空集合A、B,对于集合A中的任一元素,若集合B中有唯一确定的元素与之对应,我们就把这种对应关系称为从A到B的映射。如果集合A、B均为实数集或其子集,我们把这个映射称为函数。如果定义域为一个一般的集合(非实数集或其子集),那么我们把这种映射称为泛函(泛函字面意思为广义的函数)。理解了这些概念后,我们再来看随机变量,不难发现它原来是个泛函(怪不得不好理解呢)。泛函的知识考研不要求,不必深究。

2. 随机变量能否表示随机事件?

这个问题也有不少同学感到困惑。我们以上面定义的这个随机变量为例,{X=1}是个随机事件吗?是。可以有两个理解角度:其一,它可以写成{X=1}={e|X(e)=1}={正},这是一种反对应:由函数因变量的取值反对应自变量的取值。大家可以体会一下如何用随机变量表示随机事件;其二,X有两种可能的取值0,1,并且以一定的概率取每个值,而可以考虑概率的事件自然是随机事件了。所以以后见到一个随机变量,我们不一定要弄清它是如何定义的(有时这是困难的),只要我们能分析出这个变量有若干种可能的取值,取每个值有相应的概率即可认可其为随机变量,进行下一步分析即可。

类似地,{X<=1}也是随机事件。而且这种方式表示的随机事件有重要应用。正如深挖群众提供的贪腐线索有可能揪出大老虎,深入理解基本概念可能会有意想不到的收获。由{X<=1}为随机事件,不难得到{X<=a}亦为随机事件(其中a为给定的实数)。进一步,{X<=x}是随机事件吗(x为变量,且不具有随机性)?给定x,{X<=x}为一个随机事件;若给定不同的x,就得到不同的随机事件。如果x的取值范围是全体实数,我们就得到了一系列的随机事件。而每个随机事件又可以与一个概率对应。这样,对于每个x,有唯一确定的实数与其对应,这就确定了函数关系。这个函数是与X有关的,我们称其为X的分布函数。是不是有点意外的收获?

走笔至此,我忍不住要说两句“形而上”的东西。为什么有同学感觉课上听懂了,课下却不会做题?一个重要的原因是上课是学生跟着老师的思路走,缺少主动探索和“试错”。我们碰到一道题就像路过一个十字路口,有前后左右四个方向可选,而最终我们会选择其中一个方向走下去。那为什么要选这个方向?很多时候,我们要用主动的试错去减少可能性,用试错去建立自己的经验系统,进而依据经验系统做决策。而这种试错最好在平时完成(在考场上试错就“悲剧”了)。

3. 为什么要引入随机变量?

随机变量是把随机试验的结果与实数对应起来,方便用数学工具处理。没有随机变量的状态,我们已经见识过了,就在概率的第一章。我们可以考虑随机事件,但每次说起来和写起来都不方便:事件中的元素可能是“正”和“反”,也可能是“1点”和“6点”,还可能是“中”和“不中”;相应地算概率可能是P{“正”},可能是P{“掷出偶数点”},还可能是P{“独立重复地射击10次,击中k次”}。而有了随机变量后,整个概率的世界就不同了:可以用P{X=1}表示掷硬币朝上的面为正面,表示掷骰子掷出偶数点,还可以表示射击命中,只需要修改随机变量X的定义即可;此外,我们可以进一步定义X的分布函数,那么高等数学就可以作为一个工具来为概率统计服务了,比如求极限,求导这些基本计算可以对分布函数进行。

原文地址:https://www.cnblogs.com/invisible2/p/10660359.html

时间: 2024-08-30 15:16:22

第二章 随机变量及其分布的相关文章

PRML第二章笔记

这是关于PRML第二章的学习笔记.主要从内容思想的理解,具体的理论推导需要结合原文以及概率论的知识.这一章主要讲概率分布,概率分布的?个作?是在给定有限次观测x1, - , xN的前提下,对随机变量x的概率分布p(x)建模.这个问题被称为密度估计,分为二元 多元 高斯 以及先验分布 beta 狄利克雷分布,最后将这些分布统一到指数簇家族一类中. 引言:概率分布分为两个经典学派,频率学派和贝叶斯学派. 频率学派关注数据,认为数据是不会说谎的,一切以数据为中心,采用最大似然函数来求取data 的概率

数据结构与算法分析C++表述第二章编程题

把昨天看的第二章巩固一下,做一做编程习题. 2.6: 第一天交2元罚金,以后每一天都是前一天的平方,第N天罚金将是多少? 这个题目和2.4.4-3介绍的幂运算基本一致.若按相同的递归思路分析,比那个问题要简单,因为从1次幂开始并且指数呈2^(n-1)分布,即1,2,3,4,16……所以没有对指数是奇数时的判定.实际上用循环来求要比用递归快.在不考虑溢出的前提下,解法如下: #include<iostream> using namespace std; typedef unsigned long

读书笔记:计算机网络第二章:物理层

这是我在Coursera上的学习笔记.课程名称为<Computer Networks>,出自University of Washington. 由于计算机网络才诞生不久,目前正在以高速在发展,所以有些旧的教材可能都已经跟不上时代了.这门课程在2013年左右录制,知识相对还是比较新的.覆盖了计算机网络中的各个协议层,从物理层到应用层都讲得非常仔细.学完这门课程之后对计算机网络会有比较深刻的了解. 本章详细讲解了物理层,讲解了比特流如何通过各种介质进行传播. 基本概述 物理层的功能 专注比特信号是

数据结构——线性表(第二章)

一.基本概念 1.线性表:简称表,是n(n>=0)个具有相同类型的数据元素的有限序列,线性表中数据元素的个数称为线性表的长度.长度为零时称为空表. 2.线性表的顺序存储结构称为顺序表. 3.单链表:单链表是一组任意的存储单元存放线性表的位置,这组存储单元可以连续也可以不连续,甚至可以零散分布在内存中的任意位置. 下面着重介绍有关单链表的操作: #include<iostream> using namespace std; const int maxsize = 10; // 定义单链表的

Laxcus大数据管理系统(5)- 第二章 数据组织

第二章 数据组织 在数据的组织结构设计上,Laxcus严格遵循数据和数据描述分离的原则,这个理念与关系数据库完全一致.在此基础上,为了保证大规模数据存取和计算的需要,我们设计了大量新的数据处理技术.同时出于兼顾用户使用习惯和简化数据处理的目的,继续沿用了一些关系数据库的设计和定义,其中不乏对SQL做适量的修订.在这些变化中,核心仍然是以关系代数的理念去处理数据,以及类自然语言风格的数据描述.所以用户在使用体验上,和关系数据库相比,不会感觉到有太多的差异. 本章将介绍Laxcus数据结构的组成,并

【《Real-Time Rendering 3rd》 提炼总结】(二) 第二章 图形渲染管线 The Graphics Rendering Pipeline

本文由@浅墨_毛星云 出品,转载请注明出处.   文章链接:http://blog.csdn.net/poem_qianmo/article/details/70544201 这篇文章是解析计算机图形学界"九阴真经总纲"一般存在的<Real-Time Rendering 3rd>系列文章的第二篇.将带来RTR3第二章内容"Chapter 2 The Graphics Rendering Pipeline 图形渲染管线"的总结.概括与提炼. 文章分为全文内

java编程思想 第二章

这篇时间较之前篇章时间靠后,是由于,某一天晚上看完Java编程思想文献之后来不及做笔记了. 以下笔记基本为转载,不是原创 第二章   一切都是对象 目录: 2.1 用引用操纵对象 2.2 必须由你创建所有对象 2.3 永远不需要销毁对象 2.4 创建新的数据类型:类 2.5 方法.参数和返回值 2.6 构建一个Java程序 2.7 你的第一个Java程序 2.8 注释和嵌入式文档 2.9 编码风格 2.1 用引用操纵对象 一切都看作对象,操纵的标识符实际上是对象的一个“引用”,遥控器(引用)操纵

机器学习总结之第二章模型评估与选择

机器学习总结之第二章模型评估与选择 2.1经验误差与过拟合 错误率 = a个样本分类错误/m个样本 精度 = 1 - 错误率 误差:学习器实际预测输出与样本的真是输出之间的差异. 训练误差:即经验误差.学习器在训练集上的误差. 泛化误差:学习器在新样本上的误差. 过拟合:学习器把训练样本学的"太好",把不太一般的特性学到了,泛化能力下降,对新样本的判别能力差.必然存在,无法彻底避免,只能够减小过拟合风险. 欠拟合:对训练样本的一半性质尚未学好. 2.2评估方法 (在现实任务中,还需考虑

第二章、诊断

目录 第二章.诊断 一.阿斯伯格综合征的问卷和评分 二.诊断评估 三.当前诊断的标准 目前和DSM-IV相关的一些问题 四.是阿斯伯格综合征还是高功能孤独症 五.阿斯伯格综合征的患病率 六.对女孩的诊断评估 七.成人阿斯伯格综合征的诊断 成人阿斯伯格综合征评估工具 八.结束诊断评估 九.对诊断的信心 本章重点及策略 ++++++ 第二章.诊断 这些孩子一眼就能看出来,你能从那些细小的地方发现他们就是这一类孩子,从他们第一次来就诊时走进房间的样子,从他们刚开始时的行为和他们嘴里说出的第一个词. -