机器学习预备知识之概率论(下)

期望值和方差

随机变量的期望值E(X)，也称为平均数或者均值，使用下面的公式计算，这两个公式分别用于计算离散随机变量和连续随机变量的期望值：

使用上面的公式计算指示器变量（取值要么为1要么为0的随机变量）可得：

下面是与期望有关的两个重要定理，第一个是期望的线性性质：

无论随机变量是否相互独立，期望的线性性质都成立。而第二个定义只有在随机变量相互独立时才成立：

期望其它重要的性质还有：如果C是常数则E(C)=C，E(CX)=CE(X)。

方差用于衡量一个分布的离散程度，使用下面的公式计算方差：

通常使用表示方差，使用表示标准差，标准差和方差的关系为：

在已知随机变量X的期望时，可以通过下面的公式快速的计算X的方差：

上述推导过程利用了期望的线性性质以及如果C是常数则E(C)=C，E(CX)=CE(X)（此处C为E(X)）。方差不是随机变量的线性函数，比如：

如果随机变量X和Y相互独立，那么有下面的关系：

两个随机变量的协方差定义如下，协方差表示两个随机变量的相关程度：

伯努利、泊松和高斯分布

伯努利分布是最基本的分布之一，服从伯努利分布的随机变量X只能取两个值0和1，通常使用p表示X取值为1的概率，即p=P(X=1)，q为X取值为0的概率，即q= P(X=0)=1-p。由于X只能取值0和1，因此常用语表示试验是否成功。由定义可知伯努利的分布为：

还可以将上面公式概括为：。伯努利分布的期望和方差分别为p和p(1-p)，计算过程如下：

泊松分布是处理事件发生的非常有用的分布，适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数，电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等。

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率，泊松分布的质量函数为：

期望和方差都为λ，计算过程如下：

在上述的推导过程中用到了一个重要的公式：。

高斯分布也称为正态分布，是最常使用的分布之一，比如可以在试验次数非常大时用于近似的表示二项式分布，或者在平均发生率很高时近似表示泊松分布，还与大数定理有关。高斯分布由两个参数决定：期望μ和方差σ²，其公式如下：

下图为高斯分布的示例图，从该图中可以得知：期望决定正态曲线的中心位置，方差决定正态曲线的陡峭或扁平程度。方差越小，曲线越陡峭；方差越大，曲线越扁平。

在机器学习中经常会处理多变量的高斯分布，k维多变量的高斯分布可以使用参数(μ,Σ)表示，其中μ为期望值的k维向量，Σ为kxk协方差矩阵，其中Σ_ii=Var(X_i)，Σ_ij= Cov(X _i,X _j)。多变量高斯分布的概率密度函数为：

时间： 2024-08-30 13:25:07

机器学习预备知识之概率论(下)的相关文章

机器学习预备知识之概率论(上)

随着Hadoop等处理大数据技术的出现和发展,机器学习也越来越走进人们的视线.其实早在Hadoop之前,机器学习和数据挖掘早已经作为单独的学科而存在,那为什么在hadoop出现之后,机器学习如此的引人注目呢?一个重要原因是hadoop的出现使很多人拥有了处理海量数据的技术支撑,进而发现数据的重要性,而要想从数据中发现有价值的信息,选择机器学习似乎是必然的趋势.当然也不排除舆论的因素,其实本人一直对很多人宣称掌握了机器学习持怀疑态度.而要想理解机器学习的精髓,数学知识是不可或缺的,比如线性代数,概

android金阳光自动化测试——学习历程：自动化预备知识上&&下

章节:自动化基础篇——自动化预备知识上&&下网易云课堂: 上:http://study.163.com/course/courseLearn.htm?courseId=712011#/learn/video?lessonId=877113&courseId=712011 下:http://study.163.com/course/courseLearn.htm?courseId=712011#/learn/video?lessonId=877114&courseId=71

2. 自然语言处理预备知识

自然语言处理的预备知识熟练掌握Python 微积分,线性代数 (MATH 51, CME 100) 基本的概率论和统计(CS109) 机器学习基础(CS229) 自然语言处理参考书 Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft) [link] Yoav Goldberg. A Primer on Neural Network Models for Natural Language

《软件可靠性方法》笔记（一）---第二章预备知识

时间:2016.11.12: 地点:南京江宁实验室: 状态:迷茫的研一: 为什么会读到这本书?导师推荐的.可以说第一开始听到这本书名时完全是一脸蒙蔽,就像选本科毕设题目时是一样的...就是在上半年当老师告诉我他是做形式化的,我一度以为我特么的难道联系到自动化学院了?我可是一门心思向计算机的.后来直到暑假在家闲的发慌翻翻本科时候的软件课本书时,居然看到了一章讲形式化的...蜜汁尴尬,毕竟当年这门课最后我得了优.咳咳,扯远了.这本书还是蛮适合刚接触形式化的人看的,但是得有一定的数学功底(所以说我一开

[转]预备知识—程序的内存分配

因为经典,所以转发. 一.预备知识—程序的内存分配一个由C/C++编译的程序占用的内存分为以下几个部分栈区(stack) — 由编译器自动分配释放,存放函数的参数值,局部变量的值等.其操作方式类似于数据结构中的栈. 堆区(heap) — 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收.注意它与数据结构中的堆是两回事,分配方式倒是类似于链表. 全局区(静态区)(static) —,全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,

《软件调试的艺术》笔记--预备知识

1.gcc的-g选项如果要使用gdb进行调试,必须在编译时在gcc中加入-g选项,使用参数 -g 表示将源代码信息编译到可执行文件中. 如果不使用-g选项: #include <stdio.h> int main(void) { int i = 1; i = i + 1; printf("i = %d\n",i); return 0; } gcc main.c gdb a.out (gdb) b main Breakpoint 1 at 0x4004f8 (gdb) r

C++ primer plus读书笔记——第1章预备知识

第1章预备知识 1. Ritchie希望有一种语言能将低级语言的效率.硬件访问能力和高级语言的通用性.可移植性融合在一起,于是他在旧语言的基础上开发了C语言. 2. 在C++获得一定程度的成功后,Stroustrup才添加了模版,这使得进行泛型编程成为可能. 3. Linux中要支持C++11,编译源文件时要使用-std = c++0x选项: g++ -std = c++0x use_auto.cpp 4. 程序执行完毕后,有些IDE自动关闭窗口,而有些IDE不关闭.为查看输出,可以在程序的最

Qt DLL总结【一】-链接库预备知识

1.链接库概念静态链接库和动态链接库介绍我们可以创建一种文件里面包含了很多函数和变量的目标代码,链接的时候只要把这个文件指示给链接程序就自动地从文件中查找符合要求的函数和变量进行链接,整个查找过程根本不需要我们操心. 这个文件叫做 "库(Libary)",平时我们把编译好的目标代码存储到"库"里面,要用的时候链接程序帮我们从库里面找出来. 静态链接库: 在早期库的组织形式相对简单,里面的目标代码只能够进行静态链接,所以我们称为"静态库",静态

驱动开发读书笔记. 0.06 嵌入式linux视频开发之预备知识

驱动开发读书笔记. 0.06 嵌入式linux视频开发之预备知识由于毕业设计选择了嵌入式linux视频开发相关的项目,于是找了相关的资料,下面是一下预备知识 UVC : UVC,全称为:USB video class 或USB video device class.是Microsoft与另外几家设备厂商联合推出的为USB视频捕获设备定义的协议标准,目前已成为USB org标准之一. UVC linux driver: UVC linux 驱动需要在编译内核的时候选上配置内核 Device

猜你喜欢

Training的第二十九天（回校的第一天）

switch-case语句跟if-else有异曲同工之处,不同的是if-else语句中在讨论范围的时候比较常用到,而switch语句在表示多个例子的时候用得比较多.

第八节数据结构

1.栈和队列队列:BFS 栈:DFS 例题: (1)min stack: 思路:使用两个栈实现.第二个栈对应相应层为栈顶的最小值. 更节省空间的方法是:相邻层如果值相同可用计数的机制来节省空间. 代 ...

java script第一篇（按钮全选的实现）

今天刚学了java script,记录下学习新知识的点滴.以下是操作步骤. 1.新建一个文档(用NotePad软件,为了使得在浏览器中打开不是乱码,在软件的文件出找到编码,将其修改为UTF-8编码.或 ...

N皇后（回溯版+位运算版）

题目描述 Description 在n×n格的棋盘上放置彼此不受攻击的n个皇后.按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子.n后问题等价于再n×n的棋盘上放置n个皇后,任 ...

Liam的C# 学习历程（八）：数据流（Streams）

在这节C#课上,老师为我们讲述了第22章数据流的相关内容.首先我们需要用到的类在System.IO的命名空间中.这些类包括了表示磁盘上某个文件的File类,以及表示目录的Directory类. 接下来 ...

图割法

1.构建图G将边缘象素和边界段(弧)用图表示 2.构建源结点和汇结点 3.计算弧代价函数,并对图G中的各个弧赋予一定的弧代价 4.使用最大流图优化算法来确定对图G的图割,从而区分对应目标和背景象素的结 ...

mac下安装mongoDB

方式一:命令行 MongoDB的安装有好多种安装方法,有普通青年的HomeBrew方式,也有文艺青年的源码编译方式.我只想快速的装起来用一下,所以我选最简单的HomeBrew. 请参考官方文档 : h ...

转基因食品误常吃

转基因阴谋:清理"垃圾人口"--太可怕了 1995年9月27日,在美国旧金山秘密召开了一场影响深远的会议,在FairmontSanFrancisco(费尔蒙特酒店),该会议 ...

Env: Linux下Source Insight安装

1.Wine安装 sudo apt-get install wine 如果有错误,可以sudo apt-get update 2.下载source insight,注意要是安装版 http://www ...

一.组建XP团队在XP团队中,由以下组成二.项目相关环境 1.利益相关者:与PM一样,对项目进行管理 2.执行发起人:最终客户(必须定期演示) 三.XP组成四.思考 1.结对编程结对编程中,一 ...

Java学习笔记-File操作（API）

一:知识点总结 1．File类只用于表示文件(目录)的信息,不能对文件的内容进行访问. 2．创建File对象时候的路径问题 (1)File file=new File(“绝对路径”); “绝对路径”: ...

内存基础知识

下面的列表总结了重要的 CLR 内存概念. 每个进程都有其自己单独的虚拟地址空间. 同一台计算机上的所有进程共享相同的物理内存,如果有页文件,则也共享页文件. 默认情况下,32 位计算机上的每个进程都 ...

JS获取URL中参数值（QueryString）的4种方法

在某书上看到这道题目,查找解题思路后做了部分解析,如有错误请指正方法一:正则法代码如下: function getQueryString(name) { var reg = new RegE ...

http://www.w3cplus.com/animation/create-animated-text-fills.html

关于svg的资料: http://www.w3cplus.com/animation/create-animated-text-fills.html asp.net中jquery的ajax调用cs文件 ...

POST 请求静态文件响应405

使用post方式请求js.html这样的静态文件一般的web服务器都会返回405 Method Not Allowed. 我测试用的web服务器用的是IIS(windows10+IIS10),理论上来 ...

Sass 文件基础知识

sass文件名为.scss 可以设置变量 //sass style $fontStack:Heletica,sans-serif;$primaryColor:#333; body{ font-fami ...

WPF自定义控件与样式(3)-TextBox & RichTextBox & PasswordBox样式、水印、Label标签、功能扩展

原文:WPF自定义控件与样式(3)-TextBox & RichTextBox & PasswordBox样式.水印.Label标签.功能扩展一．前言.预览申明:WPF自定义控件与 ...

Xcode 菜单详解 [转载自用]

下面划了删除线的选项是太基础的选项可以忽略,标红的选项是需要注意的. 正文 1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png 1 ...

游戏 “售饼雄才” 介绍

这是我在大二下学期无聊时做的一个游戏.花了差不多一个月的业余时间.现在想来感觉还是有些小有趣的.放出来给大家玩玩. 游戏图标: 用PS做的寒酸图标.花了我好几个小时呢!最后还是觉得简洁为好,就这样画了 ...

Android 学习笔记 BroadcastReceiver广播...

PS:不断提升自己,是件好事... 学习内容: 1.BroadcastReceiver的使用.. 2.通过BroadcastReceiver去启动Service... 1.BroadcastRecei ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.