smooth l1 loss & l1 loss & l2 loss

引自：https://www.zhihu.com/question/58200555/answer/621174180

为了从两个方面限制梯度：

当预测框与 ground truth 差别过大时，梯度值不至于过大；
当预测框与 ground truth 差别很小时，梯度值足够小。

考察如下几种损失函数，其中为预测框与 groud truth 之间 elementwise 的差异：

观察 (4)，当 x 增大时 L2 损失对 x 的导数也增大。这就导致训练初期，预测值与 groud truth 差异过于大时，损失函数对预测值的梯度十分大，训练不稳定。

根据方程 (5)，L1 对 x 的导数为常数。这就导致训练后期，预测值与 ground truth 差异很小时， L1 损失对预测值的导数的绝对值仍然为 1，而 learning rate 如果不变，损失函数将在稳定值附近波动，难以继续收敛以达到更高精度。

最后观察 (6)，smooth L1 在 x 较小时，对 x 的梯度也会变小，而在 x 很大时，对 x 的梯度的绝对值达到上限 1，也不会太大以至于破坏网络参数。 smooth L1 完美地避开了 L1 和 L2 损失的缺陷。其函数图像如下：

综上所述smootn l1 loss 综合了l1 loss 和l2 loss的优点。

原文地址：https://www.cnblogs.com/lyp1010/p/11881174.html

时间： 2024-11-09 06:36:49

smooth l1 loss & l1 loss & l2 loss的相关文章

L1 loss, L2 loss以及Smooth L1 Loss的对比

总结对比下\(L_1\) 损失函数,\(L_2\) 损失函数以及\(\text{Smooth} L_1\) 损失函数的优缺点. 均方误差MSE (\(L_2\) Loss) 均方误差(Mean Square Error,MSE)是模型预测值\(f(x)\) 与真实样本值\(y\) 之间差值平方的平均值,其公式如下 \[ MSE = \frac{\sum_{i=1}^n(f_{x_i} - y_i)^2}{n} \] 其中,\(y_i\)和\(f(x_i)\)分别表示第\(i\)个样本的真实值及其

L1 loss L2 loss

https://www.letslearnai.com/2018/03/10/what-are-l1-and-l2-loss-functions.html http://rishy.github.io/ml/2015/07/28/l1-vs-l2-loss/ L1-loss L2-loss L1 loss感觉和L1范式差不多,L2 loss相较于L2范式没有开根号,或者说L2 loss就是两个值相减开平方原文地址:https://www.cnblogs.com/ymjyqsx/p/922120

C语言合并两个集合(L,L1) 将L1中不在L中的元素插入到L线性表中

void main(){ Sqlist L,L1; InitList(&L); InitList(&L1); ListInsert(&L, 1, 2); ListInsert(&L, 2, 3); ListInsert(&L, 1, 1); ListInsert(&L1,1,1); ListInsert(&L1,2,2); ListInsert(&L1,3,4); for (int i = 0; i <L1.length; i++) {

tensorflow实现svm iris二分类——本质上在使用梯度下降法求解线性回归（loss是定制的而已）

iris二分类 # Linear Support Vector Machine: Soft Margin # ---------------------------------- # # This function shows how to use TensorFlow to # create a soft margin SVM # # We will use the iris data, specifically: # x1 = Sepal Length # x2 = Petal Width

随机梯度下降分类器和回归器

随机梯度下降分类器并不是一个独立的算法,而是一系列利用随机梯度下降求解参数的算法的集合. SGDClassifier(分类): from sklearn.linear_model import SGDClassifier clf = SGDClassifier(loss="hinge", penalty="l2") loss function(损失函数): 可以通过 loss 参数来设置.SGDClassifier 支持以下的 loss functions(损失函数

torch基础学习

目录 Pytorch Leture 05: Linear Rregression in the Pytorch Way Logistic Regression 逻辑回归 - 二分类 Lecture07: How to make netural network wide and deep ? Lecture 08: Pytorch DataLoader Lecture 09: softmax Classifier part one part two : real problem - MNIST i

机器学习中的范数规则化之（一）L0、L1与L2范数

机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 转自:http://blog.csdn.net/zouxy09/article/details/24971995 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一

L0、L1与L2范数、核范数（转）

L0.L1与L2范数.核范数今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正.谢谢. 监督机器学习问题无非就是"minimizeyour error while regularizing your parameters",也就是在规则化参数的同时最

机器学习中的范数规则化 L0、L1与L2范数核范数与规则项参数选择

http://blog.csdn.net/zouxy09/article/details/24971995 机器学习中的范数规则化之(一)L0.L1与L2范数 [email protected] http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文.知识有限,以下都是我一些浅显

猜你喜欢

异常的注意事项

* a:子类重写父类方法时,子类的方法必须抛出相同的异常或父类异常的子类.(父亲坏了,儿子不能比父亲更坏) * b:如果父类抛出了多个异常,子类重写父类时,只能抛出相同的异常或者是他的子集,子类不能抛 ...

UIAutomator

UI Automator Viewer The uiautomatorviewer tool provides a convenient GUI to scan and analyze the UI ...

How Tomcat Works 2

上一节(How Tomcat Works 1 编写一个简单静态web服务器)编写了一个简单的web服务器,只能处理静态的资源,本节将继续向前迈出一个小步,创建两个不同的servlet容器,能够利用se ...

windows10系统下安装nginx的安装步骤

打开nginx的官网:http://nginx.org/,下载最新的稳定版本. 下载完成后,解压到你想要解压的文件路径中,我解压到了D盘中,并把文件名改为nginx:进入文件内,打开nginx.e ...

mysql 主从原理及配置

MySQL的Replication(英文为复制)是一个多MySQL数据库做主从同步的方案,特点是异步复制,广泛用在各种对MySQL有更高性能.更高可靠性要求的场合.与之对应的是另一个同步技术是MySQ ...

维护的JSP网站数据丢失

两个月前换了份工作,然后接手了三台服务器.上面乱七八糟的站点和应用大把.其中有维护一个瀚石苑:http://www.hanshiyuan.com/,三天两头的丢失数据.都不知道怎么找回,好在数据有备份 ...

华硕笔记本开机显示GRUB

今天给朋友维修一个华硕的笔记本,重装WIN7系统,安装完各种软件后,给他做个GHOST.但重启之后就进入不了WIN7了,真奇怪!以前没有遇见过.上网查了一些资料,试了几个不行.后来看到有一网友说使用D ...

yii第三方插件snoopy配置

首先.把snoopy类放到protected\extensions\snoopy\目录下. 其次.在yii配置文件main.php里配置import扩展进来. 'import'=>array( ...

IDEA开发spring的环境搭建

摘要: 主要讲解使用 IDEA 开发 Spring MVC 的环境搭建,Maven的简单教学. 参考1:https://my.oschina.net/gaussik/blog/385697 参考2:h ...

第四讲：CCSprite精灵类 -- 创建精灵

创建精灵类的6种方法: 1.最常用的方法 //获取屏幕大小 CCSize size = CCDirector::sharedDirector()->getWinSize(); CCSprite ...

Hadoop学习第五次：HDFS的Shell命令

调用文件系统(FS)Shell命令应使用 bin/hadoop fs 的形式.所有的FS shell命令使用URI路径作为参数.URI格式是scheme://authority/path.HDFS的s ...

解析Service之你需要了解的一些东东

何为Service Service,俗名服务.在Android系统中,Service与Activity就像一个妈生的,不仅长得像,而且行为(生命周期)也有一些类似.对于Activity来说大家肯定不会 ...

python3.X 复学（1）---最美遇见你（原文来自廖雪峰官网）

说什么在一起,无非是要别离,若生活是二进制,那么我的世界只有0和1 -----hashlinux Python是一种计算机程序设计语言.你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常 ...

下载图片出现问题

System.Net.WebException: An exception occurred during a WebClient request. System.UnauthorizedAccess ...

zw版【转发·台湾nvp系列Delphi例程】HALCON AngleLl

zw版[转发·台湾nvp系列Delphi例程]HALCON AngleLl procedure TForm1.Button1Click(Sender: TObject);var Row1, Row2 ...

git初识后的一些问题

安装git成功后,从github上无法下载代码,在网上搜索解决方法,发现需要删除文件:C:\Windows\SysWOW64\libcurl.dll,我删除了,确实好使了.但是我依旧有些疑惑. 我在整 ...

优秀代码规范

关于优雅代码风格的描述: 代码简单:不隐藏设计者的意图,抽象干净利落,控制语句直截了当. 接口清晰:类型接口表现力直白,字面表达含义,API 相互呼应以增强可测试性. 依赖项少:依赖关系越少越好,依赖 ...

微信之Android各版本列表

原文:http://www.cnblogs.com/ytkah/p/ioswx.html 前面ytkah弄了一个iso微信各版本列表,现在就来整一个微信 for Android各版本列表,方便大伙下载 ...

BEGINNING SHAREPOINT® 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览

BEGINNING SHAREPOINT? 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览本章节你将学到: 理解SP2013中可用的API选项: 学会使用新的C ...

android Activity的启动模式作用简析+demo详解

笔者近期做的一个项目用到了Activity的启动模式,也算是第一次深刻地领会到了其强大与方便.在此也是将自己所得与大家分享,自己写了一个比较简易的demo,便于让大家理解. 此篇博客意在让对启动模式不 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.028 s.