机器学习中的规则化

　　最近重新看了《机器学习实战》第八章：预测数值型数据：回归。发现了一个以前没有重视的问题，规则化（regularization），通过网上各种查找资料，发现规则化对数据的特征选择，防止回归模型过拟合都有非常大的帮助。

　　简单的讲，规则化就是给损失函数（cost function）多项式再加上一项，使得训练出的权重向量W更小一些。这样，在向量W中，就会使得一些item更趋近于0，可以认为更趋近为0的项代表的维度对模型的分类预测效果影响很小，可以选择性的忽略这些维度。

　　能够从原始数据集中提取出影响较大的维度，忽略一些影响较小的维度，就意味着能够在一定程度上防止过拟合（overfitting）。为什么？因为模型兼顾的维度越多，越容易出错，这方面有个奥卡姆剃刀原理。

　　如何选择加上的那一项呢，常用的有L1,L2范数。

　　L1范数是指向量所有item的绝对值的和:

　　

　　L2范数是指向量所有item的平方和开根号:

　　

　　Spark针对不同的损失函数模型，赋予了默认的L1或L2规则化。为什么不同的模型对应不同的规则化呢，这个并不好解释，我个人觉得还是跟数据特征和先验积累有关。不过，只要了解L1和L2的不同之处，就能灵活运用。L1与L2主要的不同之处可以从变化曲线的斜率看出，L1是线性变化，L2是乘方变化的。

　　

　　

　　

　　

时间： 2024-10-09 16:19:52

机器学习中的规则化的相关文章

浅谈机器学习中的规则化范数

一.监督学习简介监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差.最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据.多么简约的哲学啊!因为参数太多,会导致我们的模型复杂度上升,容易过拟合,也就是我们的训练误差会很小.但训练误差小并不是我们的最终目标,我们的目标是希望模型的测试误差小,也就是能准确的预测新的样本.所以,我们需要

机器学习中的规则化范数(L0, L1, L2, 核范数)

目录: 一.L0,L1范数二.L2范数三.核范数今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是"minimizeyour error while regularizing your parameters",也

机器学习中的正则化和范数规则化

机器学习中的正则化和范数规则化正则化和范数规则化文章安排:文章先介绍了正则化的定义,然后介绍其在机器学习中的规则化应用L0.L1.L2规则化范数和核范数规则化,最后介绍规则化项参数的选择问题. 正则化(regularization)来源于线性代数理论中的不适定问题,求解不适定问题的普遍方法是:用一族与原不适定问题相“邻近”的适定问题的解去逼近原问题的解,这种方法称为正则化方法.如何建立有效的正则化方法是反问题领域中不适定问题研究的重要内容.通常的正则化方法有基于变分原理的Tikhonov正则

机器学习中的范数规则化之（一）L0、L1与L2范数

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 转自:http://blog.csdn.net/zouxy09/article/details/24971995 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一

机器学习中的范数规则化

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是"minimizeyour er

机器学习中的范数规则化 L0、L1与L2范数核范数与规则项参数选择

http://blog.csdn.net/zouxy09/article/details/24971995 机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显

paper 126：[转载] 机器学习中的范数规则化之（一）L0、L1与L2范数

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是“minimizeyour er

paper 27：机器学习中的范数规则化之（二）核范数与规则项参数选择

机器学习中的范数规则化之(二)核范数与规则项参数选择 [email protected] http://blog.csdn.net/zouxy09 上一篇博文,我们聊到了L0,L1和L2范数,这篇我们絮叨絮叨下核范数和规则项参数选择.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 三.核范数核范数||W||*是指矩阵奇异值的和,英文称呼叫Nuclear Norm.这个相对于上面火热的L1和L2来说,可能大家就会陌生点.那它是干嘛用的呢?霸气登场:约束Low-Ra

机器学习中的范数规则化之（二）核范数与规则项参数选择非常好，必看

机器学习中的范数规则化之(二)核范数与规则项参数选择 [email protected] http://blog.csdn.net/zouxy09 上一篇博文,我们聊到了L0,L1和L2范数,这篇我们絮叨絮叨下核范数和规则项参数选择.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 三.核范数核范数||W||*是指矩阵奇异值的和,英文称呼叫Nuclear Norm.这个相对于上面火热的L1和L2来说,可能大家就会陌生点.那它是干嘛用的呢?霸气登场:约束Low-Ra

猜你喜欢

记一次完整的日站过程

没啥技术性.大佬就一扫而过吧.

Apache solr(三)

solr集成Tomcat,借鉴了一篇文章,那篇文章已经讲的很详细了,附上地址: 链接:http://blog.csdn.net/yzl_8877/article/details/53199355

左式堆的实现与详解

定义:左式堆(Leftist Heaps)又称作最左堆.左倾堆,是计算机语言中较为常用的一个数据结构.左式堆作为堆的一种,保留了堆的一些属性.第1,左式堆仍然以二叉树的形式构建:第2,左式堆的任意结点 ...

利用Metaweblog技术的API接口同步到多个博客网站（详细）

很早就有这个想法:自己有时候会用到多个博客,有些博客在一个网站上写完之后,要同步到其他博客网站,自己只能复制粘贴,感觉特别没意思,复制粘贴的麻木了.一直在想有哪些技术能实现一次写博,多站同步.最近网上 ...

图形验证码的生成(数字和英文大小写)和提交验证

最初接触时,感觉很好玩,然后就自己研究了下,做了个demo,然后整理下,下次可以直接使用啦,英文大小写,点击可以切换上代码了.... 页面代码: <img id="Img" ...

初接触 Swift

// Swift 没有 main 函数没有占位符 OC 中的字符串数组字典等都要用到 @ 但 Swift 中都不在用 @ // 常用的数据类型let b1:Int = 10let b2:Dou ...

网页动态背景——随鼠标变换的动态线条

先上一张效果图. 代码如下: <script type="text/javascript" src="https://cdn.bootcss.com/canvas- ...

Redis五种基本数据结构

1.字符串示例: 2.列表示例: 3.集合示例: 4.散列示例: 5.有序集合待续...

构建MySQL服务器

MySQL是一个开放源码的小型关联式数据库管理系统,开发者为瑞典MySQL AB公司, 目前属于Oracle公司,MySQL被广泛地应用在Internet上的中小型网站中.由于其体积小.速度快.总体拥 ...

Mysql之创建和操纵表

1.建表表创建基础为利用CREATE TABLE创建表,必须给出下列信息: ? 新表的名字,在关键字CREATE TABLE之后给出: ? 表列的名字和定义,用逗号分隔. CREATE TABLE语 ...

Example Microprocessor Register Organizations

COMPUTER ORGANIZATION AND ARCHITECTURE DESIGNING FOR PERFORMANCE NINTH EDITION

jQuery初始化加载的实现

与jQuery事件模块的其他事件不同,其他事件是通过数据缓存实现的,而初始化事件,jQuery.ready则是通过回调函数列表实现的.以下是对jQuery源代码中的ready事件进行了简化的代码.具体 ...

tyvj[1089]smrtfun

描述现有N个物品,第i个物品有两个属性A_i和B_i.在其中选取若干个物品,使得sum{A_i + B_i}最大,同时sum{A_i},sum{B_i}均非负(sum{}表示求和). 输入格式第一 ...

UML - 1 用于敏捷开发的总结

UML的使用方式草稿蓝本开发语言在敏捷开发中我们常以草稿的方式来使用UML. 图敏捷开发中我们常用到的图是类图跟序列图.我们用这两种图来分析识别领域模型.这些图形识别出来的概念将形成我们对相 ...

10G 个整数找出中位数，内存限制为 2G

题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数.内存限制为 2G.只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存). ...

android 保存用户名和密码设置等应用信息优化

1.传统的保存用户名,密码方式 SharedPreferences Editor editor = shareReference.edit(); editor.putString(KEY_NAME,& ...

Physical (Raw) Versus Logical Backups

[Physical (Raw) Versus Logical Backups] Physical backups consist of raw copies of the directories an ...

清空、删除数据

//清空数据,清空表中数据 truncate table user //删除某字段='XXXX'的数据 delete from login where uid='xxxx'; //删除指定行的数据 d ...

最短路径中的松弛技术

松弛(relaxation):指对于图 G = (V, E) 中每个顶点v ∈ V,都设置一个属性dist[v],用来描述从源点s到v的最短路径上权值的上界.在开始进行一个最短路径算法时,只知道图中 ...

code complete part2

基本数据类型: 1. 程序主体中仅能出现的数字就是0和1,除此之外,所有的数字都要用宏定义或者const类型,用清晰的变量名描述用途 2. 预防除零错误, assert(denominator!=0) ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.046 s.