L1和L2特征的适用场景

How to decide which regularization (L1 or L2) to use?

Is there collinearity among some features? L2 regularization can improve prediction quality in this case, as implied by its alternative name, "ridge regression." However, it is true in general that either form of regularization will improve out-of-sample prediction, whether or not there is multicollinearity and whether or not there are irrelevant features, simply because of the shrinkage properties of the regularized estimators. L1 regularization can‘t help with multicollinearity; it will just pick the feature with the largest correlation to the outcome. Ridge regression can obtain coefficient estimates even when you have more features than examples... but the probability that any will be estimated precisely at 0 is 0.

What are the pros & cons of each of L1 / L2 regularization?

L1 regularization can‘t help with multicollinearity. L2 regularization can‘t help with feature selection. Elastic net regression can solve both problems. L1 and L2 regularization are taught for pedagogical reasons, but I‘m not aware of any situation where you want to use regularized regressions but not try an elastic net as a more general solution, since it includes both as special cases.

时间： 2024-10-10 21:17:00

L1和L2特征的适用场景的相关文章

大白话5分钟带你走进人工智能-第十四节过拟合解决手段L1和L2正则

第十四节过拟合解决手段L1和L2正则第十三节中,我们讲解了过拟合的情形,也就是过度的去拟合训练集上的结果了,反倒让你的模型太复杂.为了去解决这种现象,我们提出用L1,L2正则去解决这种问题. 怎么把正则应用进去?我们重新审视目标函数,以前我们可以理解目标函数和损失函数是一个东西.而有正则的含义之后,目

正则化L1和L2

基于距离的norm1和norm2 所谓正则化,就是在损失函数中增加范数,那么老调重弹一下,所谓范数是指空间向量的大小距离之和,那么范数有值单一向量而言的范数,其实所谓单点向量其实是指指定向量到原点的距离. d = Σ||xi||· 还有针对两个向量求距离的范数:那么作为距离,最常用到的就是马哈顿距离,这个距离也被称之为norm 1: 对于两个向量norm1的应用有两个: SAD(sum of absolution,绝对偏差和)= ||x1 - x2|| = Σ|x1 - x2| MAE(mean

机器学习中的范数规则化之（一）L0、L1与L2范数

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 转自:http://blog.csdn.net/zouxy09/article/details/24971995 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一

L1比L2更稀疏

1. 简单列子: 一个损失函数L与参数x的关系表示为: 则加上L2正则化,新的损失函数L为:(蓝线) 最优点在黄点处,x的绝对值减少了,但依然非零. 如果加上L1正则化,新的损失函数L为:(粉线) 最优点为红点,变为0,L1正则化让参数的最优值变为0,更稀疏. L1在江湖上人称Lasso,L2人称Ridge. 两种正则化,能不能将最优的参数变为0,取决于最原始的损失函数在0点处的导数,如果原始损失函数在0点处的导数不为0,则加上L2正则化之后(+2Cx),导数依然不为0.而加上L1正则化(导数

L0、L1与L2范数、核范数（转）

L0.L1与L2范数.核范数今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是"minimizeyour error while regularizing your parameters",也就是在规则化参数的同时最

机器学习中的范数规则化 L0、L1与L2范数核范数与规则项参数选择

http://blog.csdn.net/zouxy09/article/details/24971995 机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显

paper 126：[转载] 机器学习中的范数规则化之（一）L0、L1与L2范数

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是“minimizeyour er

机器学习中正则化项L1和L2的直观理解

正则化(Regularization) 机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作?1-norm和?2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数. L1正则化和L2正则化可以看做是损失函数的惩罚项.对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归).下图是Python中Lasso回归的损失函数,式中加号后面一项α||w||1即为L1正则化项. 下图是Python中Ri

L0、L1与L2范数

监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差.最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据. 因为参数太多,会导致我们的模型复杂度上升,容易过拟合,也就是我们的训练误差会很小.但训练误差小并不是我们的最终目标,我们的目标是希望模型的测试误差小,也就是能准确的预测新的样本.所以,我们需要保证模型“简单”的基础上最小化训练

猜你喜欢

幽门螺旋菌（17）_口腔分布

The mouth may also affect general health by actingas a reservoir for opportunistic pathogens. Oralhy ...

命令行主机名修改

在VirtualBox中安装了Ubuntu操作系统后,使用命令行时,发现默认的主机名太长,看上去碍眼,网上找到了如下的设置步骤 1. 切换到root 账户: sudo su 2. 输入命令 sudo ...

Ubuntu 下新建用户

# 新建用户 sudo useradd genter -m -s /bin/bash -m 创建用户主文件夹 -s 新用户的默认shell # 设置密码 sudo passwd genter # 添加 ...

Gradle Build速度加快终极方法（android studio）

Android Studio用起来越来越顺手,但是却发现Build的速度实在不敢恭维,在google和度娘了几把(....)之后,大体就是分配更高的内存,步骤:Setting-->搜索gradl ...

nginx操作系统

nginx 编辑 Nginx ("engine x") 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.Nginx是由Igor Sysoev为俄 ...

border-collapse 各边框的显示优先级

border-collapse 属性设置表格中相邻td的边框是否被合并为一个单一的边框,还是象在标准的 HTML 中那样分开显示. 默认值: separate 继承性: yes 版本: CSS2 Ja ...

hdu 5901 Count primes 素数计数模板

转自:http://blog.csdn.net/chaiwenjun000/article/details/52589457 计从1到n的素数个数两个模板时间复杂度O(n^(3/4)) 1 #in ...

13、Trigger表达式

Trigger表达式: Zabbix Trigger的表达式高度灵活,可以创建出非常复杂的测试条件,基本的触发器表达式如下: {<server>:<key>.<funct ...

如何改变CSS样式

我用了一个博客样式,他的样式有点错位,摆弄了几个小时,终于找到了,怎么改变他.</br> 先进入设置,让后在CSS中输入: <style type="text/css&qu ...

DescriptionResourcePathLocationType Dynamic Web Module 3.0 requires Java

先保证ide的所有jdk都在1.6及以上,如果还是错就试试下面的在<build></build>中添加 <plugins> <plugin> < ...

python list tuple dict

很意外,我的博客居然有人访问,还有一位仁兄来评价,点赞,莫名感激一 list name = ["aaa","bbb","ccc& ...

Stanford机器学习---第六讲. 怎样选择机器学习方法、系统

原文见http://blog.csdn.net/abcjennifer/article/details/7797502 添加了一些自己的注释和笔记本栏目(Machine learning)包括单参 ...

SVN的搭建及使用（三）用TortoiseSVN修改文件,添加文件,删除文件,以及如何解决冲突，重新设置用户名和密码等

添加文件在检出的工作副本中添加一个Readme.txt文本文件,这时候这个文本文件会显示为没有版本控制的状态,如图: 这时候,你需要告知TortoiseSVN你的操作,如图: 加入以后,你的文件会变 ...

1.SVN

1.SVN安装 SVN服务器端VisualSVN Server(64位OS必须装64位VisualSVN-Server,默认端口是443). 就像建立数据库一样,需要先在svn服务器VisualSVN ...

glusterFS分布式存储部署流程

转自:http://bangbangba.blog.51cto.com/3180873/1712061 GlusterFS是一款非常易于使用的分布式文件存储系统,实现了全部标准POSIX接口,并用fu ...

用javascript实现简单的动画效果的一个小实例

一.主要功能介绍:打开页面时文字会动态的从上面滑下来.下面的箭头链接会自动闪烁. 二.实时视图如下: 三.原代码如下 <!DOCTyPE html> <head> <sc ...

python 上传文件到服务器

def upload(filename): #buld post body data boundary = '--xxxxxxxxxxxxxxxx ' http_url='http://xx.xx.c ...

DNS的随谈

DNS的简介 DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串.通 ...

centos7 创建普通用户，添加sudo权限，禁止root远程登录和公钥登录脚本

笔记: groupadd 6lxx useradd -s /bin/sh -d /home/6lxx -g 6lxx -m 6lxx echo "KFi0Tu45"|passwd ...

POJ3009 Curling 2.0(DFS 好题)

Curling 2.0 Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 15262 Accepted: 6334 Desc ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.