机器学习基石笔记-Lecture 5-7 VC dimension

为了引出VC维做了很长的铺垫。。VC维：用来描述假设空间的表达能力。

第四节讲到对有限的假设空间，只要N足够大，不管A如何选g，训练数据如何选取，g的训练错误率和真实的错误率都很接近。

现在先解决无限假设空间的问题。

希望找到一个 m_H 来替代无限大的M。

系数M的来源是因为对bad data的概率值进行了累加。

但是其实一些h在同一个data上是重叠的，union bound将概率放大了。这样就希望对h进行一些划分，找出在data上表现类似的h，归为一类。

这里举出了二维感知机分类的例子，来说明平面上只存在有限个h类。

然后引出成长函数和 break point的概念。

dichotomy: 二分

假设空间对N个有限的样本的各种划分产生相应的分割平面的个数，有上界2^N。

成长函数：

几种成长函数

如果想用成长函数替代M，希望m_H(N)不要随N增长的太快。

shatter:

数据集D被假设空间H打散（shatter），当且仅当对D的每个划分，存在H中的某假设与此划分一致。即当D的每种可能划分可由H中的某个假设来表达时，称H打散D。

如果一个数据集合没有被假设空间打散，那么必然存在某种划分可被定义在数据集中，但不能由假设空间表示。

H的这种打散数据集合的能力是其在这些数据上定义目标函数的表示能力的度量。可以说被打散的X的子集越大，H的表示能力越强。

break point:

对二维感知机来说，当N=4时，无法被shatter，break point = 4.

bounding function 上界函数

当break point 为k时，成长函数能不能被一个多项式上界限制住？

一堆证明后…… B(N,k) = O(N^(k-1))

成长函数mH(N)<= 上限函数B(N,k) <= 多项式函数poly(N)，只要成长函数有Break Point存在，那么该成长函数就是一个多项式。

然后推导出了VC bound。。。

如果假设空间存在有限的break point，那么m_H(2N)会被最高幂次为k–1的多项式上界给约束住。随着N的逐渐增大，指数式的下降会比多项式的增长更快，所以此时VC Bound是有限的。更深的意义在于，N足够大时，对H中的任意一个假设h，Ein(h)都将接近于Eout(h)，这表示学习可行的第一个条件是有可能成立的。

至此，如要问题是可学习的，那么需要：

好的假设空间，即存在break point
好的数据，使Ein与Eout接近
好的算法，找到一个Ein很小的g

VC dimension:

d_vc 定义为比 break point 小一的数。是能够被H shatter的最大的样本空间的样本数量。由vc bound可知 VC维有限的假设是好假设。

如果我们将假设集合的数量|H|比作假设集合的自由度，那么VC维就是假设集合在做【二元分类】的有效的自由度，即这个假设空间能够产生多少Dichotomies的能力（VC维说的是，到什么时候，假设集合还能shatter，还能产生最多的Dichotomies）。

vc维可以近似地认为等于假设空间的参数个数。

如果要做一个好的预测，那么需要解决下面两个问题。

从vc维的角度来描述，如果它比较小，那么发生预测偏差很大的坏事情的可能性也就很小，那这有利于Ein接近Eout；但是，这是我们的假设空间的表达能力受到了限制，这样Ein可能就没有办法做到很小。

如果它比较大，那么假设空间的表的能力很强，Ein可以很小，但是发生坏的预测的可能性就很大。

模型复杂度：

图示说明，d_vc超过某一值后，模型的复杂度越高，它的泛化能力越差，即在out of sample上表现更差。对应的是过拟合。

样本复杂度：

描述在假设模型给定下，需要多少数据才能保证这个假设在大概率下是好的。

总结：如果假设空间的VC维是有限的，并且有足够多的数据，我们的算法又可以找到一个假设使得训练错误率很低的话，我们就可以学习到有效的模型或知识。

时间： 2024-12-10 18:04:06

机器学习基石笔记-Lecture 5-7 VC dimension的相关文章

机器学习基石——第7-8讲.The VC dimension

本栏目(机器学习)下机器学习基石专题是个人对Coursera公开课机器学习基石(2014)的学习心得与笔记.所有内容均来自Coursera公开课Machine Learning Foundations中Hsuan-Tien Lin林轩田老师的讲解.(https://class.coursera.org/ntumlone-002/lecture) 第7讲-------The VC dimension 一.VC dimension的定义 VC dimension是什么呢?大家可能猜到了,这是和我们上

机器学习基石第七讲 The VC Dimension

一.Definition of VC Dimension

机器学习基石笔记-Lecture 3 Types of learning

介绍了机器学习中的几类问题划分. 半监督学习能够避免标记成本昂贵的问题. 强化学习,可以看做是从反馈机制中来学习. 在线学习,数据一个接一个地产生并交给算法模型线上迭代. 主动学习,机器能针对自己没有信心的数据提问,得到答案后再学习. 针对特征空间也有分类,比如具体的特征.原始的(个人理解是人为可提取的)特征和抽象的(个人理解是难以提炼的)特征.

机器学习基石笔记-Lecture 9 Linear regression

线性回归的任务是对于一个输入,给出输出的实数,保证和真实输出相差越小越好.因为假设空间是线性的,所以最后的g会是直线或者平面. 通常的误差衡量方法是使用平方误差接下来的问题是如何最小化 Ein 将Ein写成矩阵形式, 注意到Ein是w的函数,是连续的.可微的.凸函数. 对w求偏导使之为0则可以求出最优点. 这是一个关于w的一次方程. 在不可逆时,它的 pseudo-inverse仍然存在,只是会有多个,选取其中一个去得到w即可. 线性回归是一个学习算法吗? 先来看一看它的Ein H也可以

机器学习基石笔记-Lecture 10 Logistic regression

soft binary classification的概念:软二分类,不直接化为-1.1,而是给出一个概率值. 目标函数是一个概率值,但是拿到的data中y只有0.1(或者-1.1),可以看做是有noise的data. logistic hypothesis 通过 theta 转化为 0.1间的数. 目标函数f(x)其实呢就是,那么那么对N个样本,产生的概率是对于f的估计h,似然函数为那么有: 使用w替换掉h,即求w的极大似然估计化简后等价于最后的Ein就是cross-entropy

机器学习基石笔记-Lecture 4 Learning is possible

hoeffding 不等式说明了在样本量足够大时,抽样估计能够接近真实值. 类比到ml中,对给定的一个假设空间中的h, 它在整个样本空间中的表现可以由在部分样本点上的表现来近似.也就是说样本足够多的时候,Ein与Eout近似相等. 现在已经知道对任意给定的h,在N足够大时,Ein近似于Eout,如果 Ein 非常小,那么Eout也就小,就说明这个 h 和真实的 f 在很大概率上是很接近的. 现在的一个问题是,如果在多个假设中,其中一个假设h针对训练数据的输出都是正确的,也就是Ein为0,是不

机器学习基石笔记7——为什么机器可以学习（3）

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记6——为什么机器可以学习（2）

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记15——机器可以怎样学得更好（3）

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

猜你喜欢

垃圾收集器

垃圾收集器引用计数器: 从gc日志可以看出是回收了,java虚假没有选用引用计数器算法管理内存可达性分析算法 ?线程池中线程是维持一个数量还是,用已经有的线程? 回收方法区垃圾收集器垃圾收集器 ...

hdu 1874 畅通工程(最短路)

畅通工程续 Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Subm ...

c++注释

#include<stdio.h> #include<stdlib.h> #include<assert.h> #include<string.h> c ...

python(6)

多线程开发 1.threading.Thread模块 ·start ·getName():获取名称 ·setName():设置名称 ·isDaemon() ·setDaemon() ·join(tim ...

jQuery整理笔记目录

jQuery整理笔记目录 jQuery整理笔记一----jQuery开始 jQuery整理笔记二----jQuery选择器整理 jQuery整理笔记三----jQuery过滤函数 jQuery整理笔记 ...

Chromium网页输入事件处理机制简要介绍和学习计划

用户在浏览网页的时候,需要与网页进行交互,常用的操作如滑动.捏合网页,以及点击网页中的链接等.这些交互操作也称为用户输入事件,浏览器需要对它们作出迅速的响应,例如及时更新网页内容或者打开新的网页等.浏 ...

基于 Arduino 的温度+湿度传感器

虽然根本不懂电路,但经过查阅资料,总算是实现了.在这里做一个记录,以免忘记. 开发环境硬件 Arduino uno r3 开发板,点我看Arduino各版本的比较,uno的第3个版本,也是目前市面上 ...

Android的SQLiteDataBase小项目，实现user类登陆注册以及student类增删改查

关于SQLiteDataBase这块,大体有两种主要的实现方式,一种是不使用Helper类的方式,此种方式存在一个弊端,即不能oncreate两次,如果重复使用oncreate的button,则会报错 ...

一些变量的比较

1.静态变量 static 什么是静态变量:从面向对象的角度触发,当需要一个数据对象为整类而非某个对象服务,同时有力求不破坏类的封装性,既要求此成员隐藏在类的内部,有要求对外不可见的时候,就可以使用 ...

OC10-Block

Block Block类型无参数无返回值 block自己不会执行,必须调用才会执行block大括号里的代码段 void (^block)() = ^(){ NSLog(@"无参数" ...

（转:收藏）怎样把数据库连接字符串存入注册表中

如果我们将连接数据库的信息存入注册表中,就能极大地提高连接信息的安全性.本文就是介绍如何将连接数据库的信息存储到注册表中,以提高数据库连接信息的安全性. 数据库的连接字符串是用数据库开发所必须的信息, ...

shell入门-特殊符号

特殊符号:* 说明:通配符,多个字符.所有后缀为”.txt“的文件列出来 [[email protected] 111]# ls *.txt11.txt 1.txt 22.txt 2.txt 33.t ...

mysql varchar类型使用心得

自己的一个例子,在存储一个email的需求中.mysql定义的字段,类型:varchar 长度:20 当我插入一个email:[email protected] 发现怎么样都差不进去..后面才发现原 ...

VB API 之透明窗体创建

首先我们要用到的API函数有SetWindowLong,GetWindowLong,SetLayeredWindowAttributes. SetWindowLong函数原型: Private Dec ...

redis cluster官方集群的搭建笔记

参考文档: https://www.zybuluo.com/phper/note/195558 http://www.cnblogs.com/shihaiming/p/5949772.html htt ...

HoloLens之父：智能手机已死未来人人都戴头盔

原文标题:HoloLens之父:智能手机已死未来人人都戴头盔在智能手机市场,无论是在硬件产品还是操作系统,微软遭遇了惨败,关闭业务被认为只是时间早晚的问题.微软已经投入巨资,研发增强现实技术(AR ...

Android学习笔记-绘制圆形ImageView实例

现在很多的APP都很喜欢圆形的头像,这里就简单的写个圆形的ImageView~ 第三方圆形ImageView控件: RoundedImageView CircleImageView 实现代码: 自定义 ...

【论文笔记】Tracking_简略版_201608

[1]Held, D., Thrun, S., & Savarese, S. (2016). Learning to Track at 100 FPS with Deep Regression ...

CREATE OR REPLACE FUNCTION

CREATE OR REPLACE FUNCTION SF_Taishou_Ksai_Date(v_receiptNum IN CHAR, ...

python--------异常处理（二）

格式如下: try: pass except Exception as e:#如果上面出错,执行下面代码 pass else:#try如果没出错执行此下面代码 pass fin ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.029 s.