《机器学习导论》第二章 监督学习 学习笔记

训练集上训练的模型在多大程度上能够对新的实例预测出正确输出称为泛化(generalization)

对最好的泛化来说,我们应当使假设的复杂性和潜在数据的函数的复杂性相匹配。如果假设没有函数复杂,例如,当试图用直线拟合从三次项式抽取的数据时,称为欠拟合(underfitting)。在这种情况下,随着复杂性的增加,训练误差和确认误差都会降低,但是,如果我们假设太浮渣,数据不足以约束该假设,我们最后也许得不到好的假设。或者如果存在噪声,则过分书杂的假设可能不仅学习潜在的函数,而且也学习数据中的噪声导致很差的拟合,称为过拟合(overfitting)

我们可以引用三元权衡(triple
trade-off)来总结以上的讨论。在所有的有实例数据训练的学习算法中,存在以下三种因素之间的平衡:

拟合数据的假设的复杂性,即假设类(hypothesis class)的能力

训练数据的总量

在新的实例上的泛化误差

随着训练数据量的增加,泛化误差降低。随着模型复杂性的增加,泛化误差先降低,然后开始增加。过于复杂的假设的泛化可以通过增加训练数据的总量来控制,但是只能达到一定程度。

在学习第二章的过程中,刚开始被各种概念弄的头大,还有各种概念之间的隶属关系。但是看几次就会发现,其实没什么,只是不得不引入那么多数学符号才能把问题说的系统、清晰一点。知识点都是以前概率论矩阵之类的基础知识,只不过重新组合一下,到目前为止还不难。

本章大概介绍了一下监督学习的分类和回归。

从离散数据到连续数据,把这两者的关系疏离了一下。

时间: 2024-10-19 14:04:49

《机器学习导论》第二章 监督学习 学习笔记的相关文章

C++primer(第五版)第二章的学习笔记(也有对部分习题的解答和指出c++11特性)

算术类型分为两类:整型(字符和bool在内)和浮点型. C/C++算术类型 类型 含义 最小尺寸 bool 布尔类型 未定义 char 字符 8位 wchar_t 宽字符 16位 char16_t Unicode字符 16位 char32_t Unicode字符 32位 short 短整型 16位 int  整型 16位 long 长整型 32位 long long 长整型 64位 unsigned long 无符号长整型 32位 double 双精度浮点数 10位有效数字 long doubl

o'Reill的SVG精髓(第二版)学习笔记——第十一章

第十一章:滤镜 11.1滤镜的工作原理 当SVG阅读器程序处理一个图形对象时,它会将对象呈现在位图输出设备上:在某一时刻,阅读器程序会把对象的描述信息转换为一组对应的像素,然后呈现在输出设备上.例如我们用SVG的<filter>元素指定一组操作(也称作基元,primitive),在对象的旁边显示一个模糊的投影,然后把这个滤镜附加给一个对象: <fliter id="drop-shadow"> <!-- 这是滤镜操作 --> </fliter&g

Lua程序设计(第二版)学习笔记(一)

前段时间认真的看了一下<lua程序设计(第二版)>这本书,每一章写一个lua脚本,诸多注释,相信给初学者有一定帮助. -- 第一章代码 print("hello Hello"); -- 全局函数 function face(n) if n == 0 then return 1 else return n + face(n - 1) end end print(face(100)); -- 1.1 程序快(chunk) -- 每段代码,源代码文件或者交互模式 的 一行 代码,

《lua程序设计 第二版》 学习笔记6 -------- 深入函数

-- 第6章 深入函数 -- 函数是一种"第一类值",他们具有特定的"词法域" -- "第一类值":与其他传统类型的值具有相同的权利.例如:存储到变量/table中,作为实参传递给函数或者作为其他函数的返回值 -- "词法域":一个函数可以嵌套在另一个函数中,内部函数可以反问外部函数的变量. local function testFun(x) return 2 * x end -- 函数定义方式1 local testFun

第二章 开始学习C++

第二章  开始学习C++ 2.1  main函数 简单代码如下: #include <iostream> int main() { //This is my first program using namespace std; cout << "Hello C++!" << endl; return 0; } C++中所有的语句都以分号(;)结束.return 0;叫做返回语句. 2.1.1  作为接口的函数头 函数头描述了函数与调用它的函数的接口.

补基础:自学:计算机科学导论 第二章 数字系统

2.2 位置化数字系统 在数字中符号所占据的位置决定了其表示的值.在该系统中,数字这样表示: +-(Sk-1  --S2S1S0 --S-l)b 它的值是: n = +-(Sk-1 * bk-1 + -- + S1 * b 1 + S0 * b0 + S-1 * b-1 + -- + S-l * b-l) S是一套符号集,:b是底(或基数),它等于S符号集中的符号总数. 2.2.1 十进制系统(以10为底) 十进制(decimal)来源于拉丁词根decem. 在该系统中,底b = 10, 并且用

算法导论 第二章

2014-12-02 20:21:40 http://www.cnblogs.com/sungoshawk/p/3617652.html 上面链接指向算法导论第二章的预习博客,很值得一看,很详细. 插入算法: 1 #include <iostream> 2 3 using namespace std; 4 void insert_sort(int *datas, int length); 5 int main() 6 { 7 int a[10]={1,2,4,35,6,1,4,7,9,7};

ScalersTalk成长会机器学习小组第7周学习笔记

ScalersTalk成长会机器学习小组第7周学习笔记 本周主要内容 - 优化目标 - 最大间隔 - 最大间隔分类的数学背景 - 核函数I - 核函数II - 使用支持向量机 本周主要知识点: 一.优化目标 - 从另一个角度看logistic回归 hθ(x)=1(1+e?θTx) if y=1 , 我们需要hθ(x)≈1,θTx>>0 if y=0 , 我们需要hθ(x)≈0,θTx<<0 - 从另一个角度看logistic回归 - 损失函数:?(yloghθ(x))+(1?y)l

老男孩视频第二部视频学习笔记(第二部)之一:命令(1)

命令:chkconfig  cat ls tail ln find wc tar cut grep egrep 一.如何过滤出已知当前目录下的所有一级目录 如何区分目录和文件:   1.利用颜色(这个依赖与CRT等工具)   2.利用 开头字母 · ls –l | grep ^d (正则表达式中一个字符 在[]中是非,在[]外面就是以什么开头) · ls –lF | grep / · ls –lF | grep /$  小结: 1.通过ls –l 以长格式显示文件属性,然后过滤以d开关的行,就是