Machine Learning — 关于过度拟合（Overfitting）

机器学习是在模型空间中选择最优模型的过程，所谓最优模型，及可以很好地拟合已有数据集，并且正确预测未知数据。

那么如何评价一个模型的优劣的，用代价函数（Cost function）来度量预测错误的程度。代价函数有很多中，在Ng的视频中，Linear Regression用的是平方代价函数：

Logistic Regression 用的是对数似然代价函数：

对于给定的含m个样本的数据集，其平均损失称为经验风险。

损失函数越小，模型就越好。

我们来分析那个房价预测问题，假设房价面积A，楼层L，房间数N相关，那我们的目标就是要通过机器学习得到一个关于A,L,N的模型，这个模型可以预测房价，但问题是我们输入是应该用A呢？还是A的平方，或者A 的三次方？（同样对L和N提问）这是个无穷尽的问题，理论上，次数越高，对于已有测试数据能拟合地越好，但是次数越高，就会使模型越复杂，这时就会出现过拟合的问题，例如下图中的第四张小图，用9次方去预测，模型能拟合每个点，但是这种模型往往对已知参数预测地很好，未知数据预测能力很差。

当模型复杂度增加时，训练误差会越来越小，以至于能拟合样本中的绝大部分点，但是测试误差却随着复杂度的增加先减小后增加，存在一个极小值。

为了解决过拟合的问题，我们引入“正则化项”，它的作用是选择经验风险和模型复杂度同时小。这样问题就转化为求经验风险和正则化项之和的最小值。

正则化项可以采取不同的形式，有L2范数，L1范数：

时间： 2024-10-12 23:21:24

Machine Learning — 关于过度拟合（Overfitting）的相关文章

过度拟合（overfitting）

我们之前解决过一个理论问题:机器学习能不能起作用?现在来解决另一个理论问题:过度拟合. 正如之前我们看到的,很多时候我们必须进行nonlinear transform.但是我们又无法确定Q的值.Q过小,那么Ein会很大:Q过大,就会出现过度拟合问题.如下图所示: 那么overfitting具体受什么因素影响呢? 现在我们又两个例子: 第一个例子的数据来源是:一个10-th的目标函数+noise:第二个例子的数据来源是:一个50-th的目标函数.现在我们用2-th函数(H2)和10-th函数(H1

overfitting(过度拟合)的概念

来自:http://blog.csdn.net/fengzhe0411/article/details/7165549 最近几天在看模式识别方面的资料,多次遇到“overfitting”这个概念,最终觉得以下解释比较容易接受,就拿出来分享下. overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据.此时我们就叫这个假设出现了overfitting的现象.出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少.而

Machine Learning Algorithms Study Notes(2)--Supervised Learning

Machine Learning Algorithms Study Notes 高雪松 @雪松Cedro Microsoft MVP 2 Supervised Learning 3 2.1 Perceptron Learning Algorithm (PLA) 3 2.1.1 PLA -- "知错能改"演算法 4 2.2 Linear Regression 6 2.2.1 线性回归模型 6 2.2.2 最小二乘法( le

【coursera笔记】Machine Learning（Week6）

发现自己不写总结真是件很恶劣的事情,好多学的东西没有自己总结都忘记了.所以决定从今天开始,学东西的时候一定跟上总结. 我写的东西大多数是自己通俗的总结,不太喜欢写严格的定义或者证明,写了也记不住,欢迎指正. 1. High Bias vs. High Variance High Bias:通常是因为模型过于简单,使得不能成功拟合数据.比如说一些有二次曲线特性的数据,如果用一次直线去拟合就会出现这个问题,所以它对应了Underfitting问题.另外,从泛化角度来说,这样的模型泛化程度更高. Hi

Andrew Ng Machine Learning - Week 3：Logistic Regression & Regularization

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记.力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 1: Introduction 笔记:http://blog.csdn.net/ironyoung/article/details/46845233 We

Machine Learning：Linear Regression With Multiple Variables

Machine Learning:Linear Regression With Multiple Variables 接着上次预测房子售价的例子,引出多变量的线性回归. 在这里我们用向量的表示方法使表达式更加简洁. 变量梯度下降跟单变量一样需同步更新所有的theta值. 进行feature scaling的原因是为了使gradient descent算法收敛速度加快.如下图所示,左图theta2与theta1的量级相差太大,这样导致Cost Function的等高图为一个细高的椭圆形状,可以看到

CS281: Advanced Machine Learning 第一节

接触机器学习领域有一段时间了,跟过不少基础的课程,也看过一些入门的书籍和论文,现在想通过一门公开课系统的进入机器学习的领域,所以选择了advanced Machine Learning,这是哈佛大学的一门高级机器学习公开课,主要教材选用的是kevin Murphy Machine Learning: A Probabilistic Perspective, MIT Press 以及Christopher M. Bishop, Pattern Recognition and Machine Lea

Machine Learning Algorithms Study Notes(3)--Learning Theory

Machine Learning Algorithms Study Notes 高雪松 @雪松Cedro Microsoft MVP 本系列文章是Andrew Ng 在斯坦福的机器学习课程 CS 229 的学习笔记. Machine Learning Algorithms Study Notes 系列文章介绍 3 Learning Theory 3.1 Regularization and model selection 模型选择问题:对于一个学习问题,可以有多种模型选择.比如要拟合一组样本点,

Machine Learning - 第7周

SVMs are considered by many to be the most powerful 'black box' learning algorithm, and by posing a cleverly-chosen optimization objective, one of the most widely used learning algorithms today. Support Vector Machines Large Margin Classification Opt

猜你喜欢

jvm学习二：类加载器

前一节详细的聊了一下类的加载过程,本节聊一聊类的加载工具,类加载器 --- ClassLoader 本想自己写的,查资料的时候查到一篇大神的文章,写的十分详细大家直接过去看吧http://blo ...

[FZYZOJ 1017] liqeuer

P1017 -- liqeuer 时间限制:1000MS 内存限制:65536KB Description 轰的一声,展现在你眼前的是两堆零件和一条岩浆"河",我们将第一堆零件定义 ...

Python入门教程系列：一、异常处理

前面几章,我们已经把Python的基础内容简单说了一些,从这章开始,我们算是入门级别的学习了,主要把剩下的一些内容说一下,主要包括异常处理.模块的使用.函数的使用.面向对象.正则匹配.数据库.网络(爬 ...

For the person you never see again

如果,你的生活中出现了个别的,忽然就没有任何音讯的人,我想,那就是你老了. 2010 年的最后2个月,忙完工作,去书店淘几本课外书籍,3000多万人里,又是这样平常的一个流程也能让人碰上老友,真可以说 ...

[bzoj4552][Tjoi2016][Heoi2016]排序

Description 给出一个到的全排列,现在对这个全排列序列进行次局部排序,排序分为种: 表示将区间的数字升序排序; 表示将区间的数字降序排序. 最后询问第位置上的数字. Input 第行为两个整 ...

程序员必备-创建js库

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255) ...

x-manager 管理 kvm虚拟机

yum groupinstall GNOME Desktop yum install dejavu-lgc-sans-fonts yum install -y virt-manager kvm命 ...

CSS布局一

CSS布局一常见布局一: div#container{ width:960px; height:650px; margin:0 auto; border:1px solid #ccc; /*就 ...

黄聪：WordPress根目录（Root）

index.php:WordPress核心索引文件,即博客输出文件. license.txt:WordPress GPL许可证文件. my-hacks.php:定义了博客输出之前处理的追加程序.默认安 ...

RHEL配置网络yum源

RHEL6.5系统配置网络Yum源概述 1.配置本地yum源: 将光盘镜像文件挂载到/mnt目录下#mount /dev/cdrom /mnt; 修改/etc/yum.repo.d/目录下的配置文件, ...

Python 学习笔记（第1课）

从今天起,我将开启python学习模式,并用博客记录学习的过程和相关知识点 1.Python下载安装可以在官网:https://www.python.org/downloads/ 中下载各种版本的P ...

eclipse中配置Tomcat服务器以及新建项目

eclipse配置Tomcat服务器 http://jingyan.baidu.com/article/ca2d939dd90183eb6d31ce79.html eclipse中配置Tomcat服务 ...

mysql 显示表字段及mysql系统信息

参考链接: http://www.cnblogs.com/zhwl/archive/2012/08/28/2660532.html SHOW DATABASES ...

python 学习笔记7 面向对象编程

一.概述面向过程:根据业务逻辑从上到下写垒代码函数式:将某功能代码封装到函数中,日后便无需重复编写,仅调用函数即可面向对象:对函数进行分类和封装,让开发"更快更好更强..." ...

json字符串转换为JSONObject和JSONArray

一.下载json 具体到http://www.json.org/上找java-json下载,并把其放到项目源代码中,这样就可以引用其类对象了二.具体转化过程 //JSONObject String ...

Engine中如何进行七参数投影转换？

来自:http://zhihu.esrichina.com.cn/?/question/6858 解决办法]:首先创建自定义geotransformation,然后用IGeometry.Project ...

hdu1561（树形背包）

给定n,m表示n个城堡,我们可以选择攻占m个城堡.要使得价值最大接下来n行 a b, 第i行的a b,表示攻占第i个城堡的价值为b,但需要先攻占第a个城堡如果有多个a=0的点,那么就不是一棵树 ...

Android自定义实现日历

最近项目中要用到Android来实现日历功能,找了很多Demo都不是自己想要的后果,最后还是在githu上找到了一个开源项目来实现这一功能先看一下Android自带的CalendarView和自定义 ...

跨平台视频通信项目-OpenTok

1 理论知识 1.1 OpenTok平台简介即时视频通信日益成为主流服务,通过WebRTC,开发者可以轻松地将即时视频通信功能加入到应用中.视频聊天创业公司TokBox推出OpenTok,可实现浏览 ...

VB计算器项目算法结构分析

还是做得不太好,多多指教啊,关注这方面的初始化:显示屏数字[dataout.Caption]为0 1.第一个因数的提取当是第一次点击数字时(程序初始化时,结果已经计算出准备下一次时,清零键按下时) ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.