CS231n 2016 通关第五章 Training NN Part1

在上一次总结中，总结了NN的基本结构。

接下来的几次课，对一些具体细节进行讲解。

比如激活函数、参数初始化、参数更新等等。

=========================================================================================

首先，课程做一个小插曲：

　　经常使用已经训练好的模型》》Finetune network

　　具体例子：

　　　　使用现成模型，修改部分层，使用现成的参数做初始参数。

　　以caffe为例，其提供了很多现成的模型：

　　　　https://github.com/BVLC/caffe/wiki/Model-Zoo

　　使用Finetune 主要是计算资源有限。

其次是上节课主要内容的简单回顾：　　

　　概括了NN的主要流程：得到数据 ---》前向传播 ---》反向传播 ---》更新参数

另外便是链式法则：

　　实例：

NN的结构特点：

　　加入非线性：

　　与神经系统比较：

　　多层NN结构：

　　注意：有些资料把输入层也算在NN的层数里。

=========================================================================================

本章的内容如下：

一些历史回顾

　　简单的字母识别系统：

　　当时就使用了伪梯度下降。其实不是严格可导。

　　之后形成了网络结构，并使用电路实现：

　　进一步形成了多层网络：

　　反向传播算法开始流行起来。

　　Deep Learning ：

　　使用了非监督学习进行预处理，然后将得到的结果放到back propagation中。如今不需要这样做了。

　　技术革新：

　　2012年的图像分类结果最优。从此DL火起来了。

技术内容总览：

=========================================================================================

1、激活函数

　　激活函数的作用：

　　常用激活函数：

　　Sigmoid：特点以及缺陷

　　比较左侧s输入值与经过f后的输出值，会导致梯度消失、数值溢出。

　　当输入为正时，偏导均为正或均为负。　

　　tanh:

　　仍然会有梯度消失的后果。

　　ReLU （Rectified Linear Unit）：

　　其不会有溢出，计算更快。当x<0时，梯度为0.

　　缺点：出现死亡状态。

　　为负值输入时，不能更新参数。一般是学习率过高导致。另外使用合适的初始化，比如加入小的bias。

　　Leaky ReLU :解决负值不能更新参数。

　　ELU：

时间： 2024-10-05 22:12:34

CS231n 2016 通关第五章 Training NN Part1的相关文章

深入浅出Zabbix 3.0 -- 第十五章 Zabbix 协议与API

今天是六.一儿童节,祝小朋友们节日快乐!发完此文就带我家小朋友出去玩耍了. 第十五章 Zabbix 协议与API 本章将介绍和开发相关的Zabbix协议和API的内容,通过对Zabbix协议和API的深入了解,你可以利用Zabbix协议编写客户端程序并将其嵌入的产品或系统中,并将数据发送到Zabbix server,这在无法安装Zabbixagent等程序的场景(例如专用的嵌入式系统)中非常有用.你也可以利用Zabbix API开发自己的业务系统,或灵活的与现有系统整合集成. 15.1 Zabb

javascript高级程序设计学习笔记第五章上

第五章引用类型的值(对象)是引用类型的一个实例.在 ECMAScript 中,引用类型是一种数据结构, 用于将数据和功能组织在一起.它也常被称为类,但这种称呼并不妥当.尽管 ECMAScript 从技术上讲是一门面向对象的语言,但它不具备传统的面向对象语言所支持的类和接口等基本结构.引用类型有时候也被称为对象定义,因为它们描述的是一类对象所具有的属性和方法. 对象是某个特定引用类型的实例.新对象是使用 new 操作符后跟一个构造函数来创建的. 构造函数本身就是一个函数,只不过该函数是出于创建新

第二篇第五章防火防烟分区于分隔

2019/1/4 [录播]2018一消精华班-实务-一级消防工程师-环球网校 http://v.edu24ol.com/?type=lesson&id=178933&gid=16157 1/8 1.第二篇第五章防火防烟分区于分隔(一) 第二篇建筑防火第五章防火防烟分区与分隔学习要求:了解防火分区面积划分应考虑的因素和常用的防火分区分隔构件,熟悉各类建筑防火分区面积要求和典型特殊功能区域的防火分隔要求,掌握防火分区.防烟分区的概念,掌握防火墙.防火卷帘.防火门.防火阀.挡烟垂壁的概

第四十五章

第四十五章1 老子是在教导我们不追求完美吗? 大成若缺,其用不弊最完美的东西,好似有残缺一样,但它的作用永远不会衰竭. 做事忘记结果,才能更坦然. 各位朋友大家好,今天我们接着来讲<道德经>,来听听老子老先生给我们带来什么样的人生启发.今天我们来到了第四十五章的讲解. 时光过的非常快,从我去年开始讲到现在,已经讲了二百多期,已经第四十五章了,<道德经>共八十一章,我们讲了一半出头了,这时间还是比较快的.有很多朋友听完以后觉得特别开心,心里不纠结了,我看到这样的留言我很开心.有人说

《大道至简》第五章读后感

失败的过程也是过程,我觉得这句话很有深意,阅读完大道至简第五章,我又有了很深的感触. 首先是“做过程不是做工程”,过程是为了实现某种目的而经历的一些事情,过程有很多种,虽然经历了某种过程,但不一定能实现某种功能.做完过程的每一个阶段,并不等于做工程.做过程不是做工程的精义,也不是最终目的. 然后是“做过场”,做过场就好像是一种形式一样,做了没必要做的事情,就是浪费时间. 做工程的最终目的是实现客户的要求,工程只是一种实现的途径.最初做开发的前辈们,不用什么工程或者过程,也一样编出了程序,也一样解

大道至简第五章读后感

第五章失败的过程也是过程今天照样老师带领着我们阅读了大道至简第五章,阅读了<大道至简>的第五章,这章在前面的基础上又进了一步,有了技术和团队,加上有效的沟通,接下来就要接项目做工程. “虚有其表耳”,本章以<明皇实录>中的一句话来告诉我们一个深刻的道理:不要只求外表,只做形象工程,而是要透过表象,力求实质. 失败了不要紧,没有失败也就找不到自己的不足,也就不会发现自己的问题,更不用谈改进了.我们的前辈们就是在不断的失败中才总结出了“瀑布模型”“螺旋模型”等模型,方便了我们.但是

第五章电子星球

第五章电子星球山高高兮.路长长,岁月悠悠兮.转眼空. 镇楼竹: 1. 秀竹一枝自宛然, 莫愁风雨损华年. 几番颠扑呈贞骨, 露重霜寒节更坚. 2. 纤纤凤竹长漓边, 不共山花斗野妍. 时对清流摇倩影, 溪流常伴乐怡然. 3. 坚节何愁风雨多, 晴天朗日更婆娑. 生凉不荫趋炎客, 惹得骚人为咏歌. 咏经典物理.戏现代理论物理: 在山泉水洁如冰, 溅玉飞珠迸有声. 流入大江清浊混, 滔滔何日见澄明. 一. 批驳现代理论

Linux与云计算——第二阶段第五章：存储Storage服务器架设—分布式存储Ceph

Linux与云计算--第二阶段Linux服务器架设第五章:存储Storage服务器架设-分布式存储Ceph 1 Ceph 配置Ceph集群 Install Distributed File System "Ceph" to Configure Storage Cluster. For example on here, Configure Cluster with 1 admin Node and 3 Storage Node like follows. | +------------

第五章搭建S3C6410开发板的测试环境

第五章本章主要介绍开发板的调试环境的搭建,以及如何将Android系统安装开发板上. 开发板是开发和学习嵌入式技术的主要硬件设备. 尽管可以在PC上开发Linux驱动,然后重新编译成ARM构架的Linux驱动模块,但最终都是要在开发板上进行测试的. 开发板从技术上说与手机类似,包含显示器.键盘.Wi-Fi.蓝牙等模块.开发板可扩展的端口多,容易开发定制的硬件. 第一节S3V6410开发板简介 S3C6410是一款低功耗.高性价比的RISC处理器,它给予ARM11内核,可以广泛应用于移动电话和通用

CS231n 2016 通关 第五章 Training NN Part1

CS231n 2016 通关 第五章 Training NN Part1的相关文章

CS231n 2016 通关第五章 Training NN Part1

CS231n 2016 通关第五章 Training NN Part1的相关文章