稀疏自动编码之梯度检验

众所周知，反向传播算法很难调试和得到正确结果，特别是在执行过程中存在许多细小难以察觉的错误。这里介绍一种方法来确定代码中导数的计算是否正确。使用这里所述求导检验方法，可以帮助提升写正确代码的信心。

假设我们想最小化关于的函数 . 对于这个例子，假设，所以 . 在一维空间，梯度下降的一次迭代公式如下：

假设我们已经实现了某个函数去计算，那么梯度下降时参数更新就可以这样：. 该如何检验我们编写的函数是正确的呢？

回忆导数的定义：

对于任意的，可以用如下公式来从数值上近似导数值：

在实践中，将 EPSILON 设定为一个极小的常数，如 .（虽然EPSILON可以取得极其小的值，如，但这样会导致数值舍入误差），通常就足够了。

现在，给定假设中计算的函数，我们可以通过如下方式检验该函数的正确如否：

到底这两个值接近到什么样的一个程度才算正确呢？要取决于的具体形似。但是假定 , 通常我们会发现上述式子左右两边的值至少有4位有效数字是一样的（甚至更多）。

现在，考虑，即参数是一个向量而不是一个实数（所以需要学习出个参数），且. 在我们的神经网络例子中使用符号, 所以我们可以想象把这许多参数全部装进一个很长的向量 . 现在，就把导数检验过程泛化到是向量的情况。

假设我们编写了一个函数计算导数，我们想要检验是否正确地计算出了导数值. 令，其中：

是第个基向量（维数与一样，只有第个元素为1，其他位置元素全部为0）.所以对于，除了第个元素比的第个元素多加了EPSILON，其他元素完全一样。类似地有：.然后就可以通过检查下面式子的正确与否来检验的正确性：

当用反向传播去训练神经网络时，正确执行的算法可以得到：

这展示在

稀疏自动编码之反向传播算法（BP）

的梯度下降伪代码中.通常用上面的方法计算出的导数值，通过它检验我们程序中和是否确实计算出了我们想要的到数值。

学习来源：http://deeplearning.stanford.edu/wiki/index.php/Gradient_checking_and_advanced_optimization

时间： 2024-08-27 00:53:28

稀疏自动编码之梯度检验的相关文章

稀疏自动编码之自动编码器和稀疏性

到目前为止,已经叙述了神经网络的监督学习,即学习的样本都是有标签的.现在假设我们有一个没有标签的训练集,其中. 自动编码器就是一个运用了反向传播进行无监督学习的神经网络,学习的目的就是为了让输出值和输入值相等,即.下面就是一个自动编码器: 自动编码器试图学习一个函数. 换句话说,它试图逼近一个等式函数,使得该函数的输出和输入很近似.举一个具体的例子,假设输入是来自一个图像(共100个像素点)像素点的灰度值,在层有个隐层节点. 注意输出 . 由于隐层节点只有50个,所以网络

稀疏自动编码之反向传播算法（BP）

假设给定m个训练样本的训练集,用梯度下降法训练一个神经网络,对于单个训练样本(x,y),定义该样本的损失函数: 那么整个训练集的损失函数定义如下: 第一项是所有样本的方差的均值.第二项是一个归一化项(也叫权重衰减项),该项是为了减少权连接权重的更新速度,防止过拟合. 我们的目标是最小化关于 W 和 b 的函数J(W,b). 为了训练神经网络,把每个参数和初始化为很小的接近于0的随机值(例如随机值由正态分布Normal(0,ε2)采样得到,把 ε 设为0.01), 然后运用批量梯度下降算法进行优

稀疏自动编码之练习

从10幅图像中采样出10000幅小图像块,每个小图像块大小是8*8,利用采样出的图像作为样本学习,利用LBFGS进行优化. 下面是对10幅图像白化之后的结果: train.m %% CS294A/CS294W Programming Assignment Starter Code % Instructions % ------------ % % This file contains code that helps you get started on the % programming ass

CS231n 卷积神经网络与计算机视觉 7 神经网络训练技巧汇总梯度检验参数更新超参数优化模型融合等

前面几章已经介绍了神经网络的结构.数据初始化.激活函数.损失函数等问题,现在我们该讨论如何让神经网络模型进行学习了. 1 梯度检验权重的更新梯度是否正确决定着函数是否想着正确的方向迭代,在UFLDL中我们提到过,计算时梯度公式如果计算错误是不容被察觉的,我们需要比较分析法得到梯度与数值法得到的梯度是否相似,下面是一些技巧: 1.1 centered formula 高等数学中我们知道导数的近似公式: df(x)dx=f(x+h)?f(x)h 以及下面的centered formula: df(

梯度检验！

梯度检验是在编写机器学习算法时必备的技术,可以检验所编写的cost函数是否正确 cost函数的主要功能是:计算代价函数.计算代价函数对参数的梯度实际程序中,梯度检验要配合cost函数一起使用 ① 给定一组样本及参数初始值 ② 利用cost函数计算grad ③ 利用computeNumericalGradient函数计算梯度的近似值numGrad ④ 比较grad和numGrad是否比较相近:如果diff小于1e-6,则cost函数是正确的,否则,需要检查cost函数 diff = norm(n

稀疏自动编码之可视化自动编码器

对于训练出的一个稀疏自动编码器,现在想看看学习出的函数到底是什么样子.对于训练一个的图像,.计算每一个隐层节点的输出值: 我们要可视化的函数,就是这个以一副2D图像为输入,以为参数(忽略偏置项),由隐层节点计算出来的函数.特别是,我们把看作是输入的非线性特征.我们很想知道:什么样的的图像能使得成为最大程度的激励? 还有一个问题,就是必须对加上约束.如果假设输入的范数约束是,可以证明,能够使得隐层神经元得到最大程度激活的像素输入 (所有100个像素点,): 展

Sparse Autoencoder稀疏自动编码

本系列文章都是关于UFLDL Tutorial的学习笔记 Neural Networks 对于一个有监督的学习问题,训练样本输入形式为(x(i),y(i)).使用神经网络我们可以找到一个复杂的非线性的假设h(x(i))可以拟合我们的数据y(i).我们先观察一个神经元的机制: 每个神经元是一个计算单元,输入为x1,x2,x3,输出为: 其中f()是激活函数,常用的激活函数是S函数: S函数的形状如下,它有一个很好的性质就是导数很方便求:f'(z) = f(z)(1 ? f(z)): 还有一个常见的

稀疏自动编码之神经网络

考虑一个监督学习问题,现在有一些带标签的训练样本(x(i),y(i)).神经网络就是定义一个复杂且非线性的假设hW,b(x),其中W,b 是需要拟合的参数. 下面是一个最简单的神经网络结构,只含有一个神经元,后面就用下图的形式代表一个神经元: 把神经元看作是一个计算单元,左边的x1,x2,x3 (和截距+1 )作为计算单元的输入,输出为:,其中,函数被称为激活函数,在这里我们的激活函数是sigmoid函数: 还有一种激活函数是正切函数(tanh function): 下面是两种激活函数图像:

深度学习UFLDL老教程笔记1 稀疏自编码器Ⅱ

稀疏自编码器的学习结构: 稀疏自编码器Ⅰ: 神经网络反向传导算法梯度检验与高级优化稀疏自编码器Ⅱ: 自编码算法与稀疏性可视化自编码器训练结果 Exercise: Sparse Autoencoder 自编码算法与稀疏性已经讨论了神经网络在有监督学习中的应用,其中训练样本是有类别标签的(x_i,y_i). 自编码神经网络是一种无监督学习算法,它使用了反向传播算法,并让目标值等于输入值x_i = y_i . 下图是一个自编码神经网络的示例. 一次autoencoder学习,结构三层:输入层

猜你喜欢

mongodb的优缺点

在这里收集下我自己对Mongodb的一些优缺点方面的认识,或者是通过其它比较可靠的网文上引用或者摘录的作为依据,这个是一个渐进的过程,也是随着我对Mongodb认识的加深而不断扩展的. (1)Mong ...

光大“乌龙指”24小时

对于身处其中的人们来说,这是最长的一天.2015年07月20日陈晓舒上海特写正午的话: 2013年8月16日11时05分,上证综指突然上涨5.96%,50多只权重股均触及涨停.造成当天市场异动的主 ...

.net core 11

C# string类型遇到的两个问题

最近在维护一位离职的同事写的WPF代码,偶然发现他使用C# string类型的两个问题,在这里记录一下. 1. 使用Trim函数移除字串中的空格.换行符等字符串. csRet.Trim(new cha ...

SQL like模糊查询

在实际的项目开发中很多时候都要进行模糊匹配,比如说匹配列值的某一部分.SQL提供了四种匹配方法: 1.%匹配 %匹配又有几种不同的用法.%atm%,前后都可以通配,得到的结果可以是"atmm ...

Java 泛型解析，太难了，认真读才能理解

Java 泛型关键字说明 ? 通配符类型 <? extends T> 表示类型的上界,表示参数化类型的可能是T 或是 T的子类 <? super T> 表示类型下界(Java ...

Hdu 4588 Count The Carries （规律）

题目地址:http://acm.hdu.edu.cn/showproblem.php?pid=4588 思路: 0 0000 1 0001 2 0010 3 0011 ...

PHP如何读取xml文件?

准备xmlwen文件:a.xml <?xml version="1.0" encoding="UTF-8"?> <humans> < ...

.net连接多个sqlserver实例

需要修改连接字符串 SqlConnection conn = new SqlConnection("server=服务器名称或ip,端口号\\sql实例名称;database=数据库名称;u ...

Android6.0动态权限申请步骤以及需要注意的一些坑

因为工作需要,简单研究了一下Android6.0权限申请,在Google提供的sample的基础上,写了一个简单的demo.算是自己的笔记吧,可能会比较混乱,主要是方便以后查看.后期有别的问题,随时更 ...

MYSQL数据库的参数文件

参数文件:告诉MySQL实例启动时在哪里可以找到数据库文件,并且指定某些初始化参数,这些参数定义了某种内存结构的大小等设置,还会介绍各种参数的类型. 参数文件当MySQL实例启动时,MySQL会先去 ...

HTML学习笔记--HTML的语法【1】

1.什么是HTML标记语言? HTML是表示网页信息的符号标记语言. 2.HTML的标记和他的属性 HTML文档的保存格式:.html..htm..xhtml 标记和被标记的内容构建出HTML文档.格 ...

谅瀑韭蔷素l5r6563z7frh9841v6uq

http://v7u0i38h.pp.163.comhttp://www.newwinner.cn/Blog/Log.aspx?bloglogid=2082313http://3188.la/arti ...

C语言学习003:Hello 指针

在C中使用指针的原因避免副本在函数调用的时候,可以只传递数据的引用,而不用传递数据数据共享两段代码可以同时操作同一份数据,而不是两份独立的副本使用指针读写数据 #include <st ...

android 检查能否上网

/** * 测试ConnectivityManager * ConnectivityManager主要管理和网络连接相关的操作 * 相关的TelephonyManager则管理和手机.运营商等的相关信 ...

myeclipse 出现 “ java.lang.NoSuchMethodError:”的报错

jsp 调用dao包下面的findById()函数时出现如下报错: 百度原因都说是 jar包有不同的版本导致的. 解决方法 . . . 看不懂. 瞎捣鼓了两个小时就放弃睡觉了. 第二天起床打开mye ...

【2012】数组（2）

给定一个数组input[] ,如果数组长度n为奇数,则将数组中最大的元素放到 output[] 数组最中间的位置,如果数组长度n为偶数,则将数组中最大的元素放到 output[] 数组中间两个位置偏右 ...

比较2

题目:给你三个数,请你按绝对值从小到大排序,对于绝对值相同的,请再按照值由小到大排序 #include<stdio.h> #include<math.h> void swap ...

正方教务处抓包分析

大概全中国的教务处网站都是一样的,选课时期总是出去薛定谔的猫的状态,因此使用爬虫来选课对于计算机的学生来说就很正常了,在进行爬虫爬取之前,我们首先需要对它进行抓包分析. 试探首先登录教务处网址,我们 ...

win7充分利用cpu来提供计算机性能

在任务栏左下角点击开始菜单,在运行框内输入msconfig,在弹出的窗口点击“高级选项”,接着会弹出一个新窗口,我们勾选“处理器数”,在下拉菜单中按照自己的电脑配置进行选择,现在双核比较常见,当然也有 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.