2016.3.28 其他的调整网络的技巧

其他的调整网络的技巧

技巧有很多,但是简单常用的不多。

首先说说对于随即梯度下降的不同变换,梯度下降其实就是用c来对于单独的一个w进行变换,但是我们如果考虑到对于不同的两个或者更多的w之间的关系呢?实际上就是用c对于多个w求多个偏导数。

Momentu就是二阶导数,原来的学习是使用c直接对于w进行修改,但是现在相当于多了一个屏障。原来走的每一步的步长实际上是和c直接相关的,但是通过momentum,加了一个代理,就是c调整一个中间的变量,中间变量再修改整体的w的值,所以再这样的情况下能够非常好的实现一个控制。

比如说我们想象一辆行驶的汽车,原来的w和c直接相关,可能一不小心就走多了,因为我们需要超像某个方向,方向是由c对w求偏导来决定的,走多少是学习率来决定的。但是这个带来的一个问题就是到底参数互相之间什么关系,要不要也微微调整以下。

其实这个也没太理解。

再有就是如何去最小化损失函数:

conjugate gradient descent , BFGS , 或者nesterov’s
accelerate gradient technique。

Sigmoid能不能换呢?其实tanh也许更好,因为对于sigmoid来说,激活的都是大于0的,这就意味着如果某个神经元是某个值,那么和这个相连的前一层的结果就都是同时增加或者减少的。而且tanh其实是sigmoid的一个缩放。还有一个比较神奇的东西就是relu(rectified linear unit)。

我们还没有明确的知道为什么这些是管用的,不过我们会继续探索。

下面问题来了:

1.    到底怎么解释这些,为什么激活函数这个就可以,有没有更好的?哪个是最好的?还是和数据有关?

时间: 2024-12-25 20:17:01

2016.3.28 其他的调整网络的技巧的相关文章

Murano Weekly Meeting 2016.06.28

Meeting time: 2016.June.28 1:00~2:00 Chairperson:  Kirill Zaitsev, from Mirantis Meeting summary: 1.Action Item Review Action: Nikolay_St kzaitsev_mb draft a spec with all the options we have considering swtiching from glance v1 to glance v2 Action: 

最详尽的PS色相调整最实用技巧介绍

这张图里的数字是经过我改过的,主要就是为了方便大家理解.是为了和色相调节相匹配.这里的数值相当于色相的数值.-180--0--180.和这张图的角度相对应.这张图可以看成每两个颜色之间相差60度.QANDA.REN计算机学习 干货:PS色相调整最实用技巧介绍 首先,做一个试验,新建一个图层,Ctrl+J复制图层,一般复制一下图层会比较安全,最好养成习惯.绘制三种颜色的矩形框.分别填充红色(R=255    G=0     B=0).绿色(R=0    G=255     B=0).蓝色(R=0

2016年pmp考试大纲调整

本次改版,主要着力于更新最近一次角色描述研究(RDS)所提供的"对于项目管理专业人士角色"的新兴描述.该项研究,基于最近对全球PMP持证者的问卷调查,收集到PM在领域.任务.知识.技能各个版块的新兴现状.从各行业.各工作岗位.各地区的项目管理实践者的视角,更新了PMP考试的部分基础信息,以确保PM考试的与时俱进与实操可行性.改版内容覆盖PMP学习内容的五大领域.其中,在项目启动领域新增3个知识点,在项目计划领域新增1个知识点,在项目执行领域新增2个知识点,在项目监视与控制领域新增2个知

【2016.11.28】纯HTML仿微博注册页面

效果如图 代码 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>新浪微博</title> </head> <body bgcolor="#BEE1F5"> <table align="center" width="896" height="186

2016.3.28 如何去确定初始参数

如何去确定初始参数 有那么多参数,比如说学习率yita,惩罚的大小lambda,以及mini-batch还有网络什么时候停止. 一个比较宏观的思路是为了验证想法,没有必要用全部的数据集,而是采用其中的一部分,验证有效了,再去使用更大的数据集合,而且为了验证想法,可以适当的减小网络的层的深度,而且做更频繁的validation,其实就是相当于做快速的小实验,能够更快的训练网络,看到想法的效果. 所以这样的想法在实验时候非常有效.记住:使用小网络进行小样本的测试. 那么对于学习来说,到底什么样的参数

2016/8/19 Linux常用命令 : 网络命令、关机重启命令

1.给用户发送信息:write  ,以Crtl + D 结束 write  用户名 2.发广播信息:wall wall  [message] 3.测试网络连通性:ping ping  选项  IP地址 -c  指定发送次数 范例:ping  192.168.1.102 4.查看和设置网卡信息:ifconfig ifconfig  网卡名称   IP地址 范例:ifconfig  eth0  192.168.1.102 5.查看发送电子邮件:mail mail  [用户名] 6.列出目前与过去登入

软件工程 2016.6.28 日报

今天,通过调查表的反馈明确了改进方向.作为组长,我负责整个项目的进度管理和质量控制,10天里的主要方向是: 1.不断进行新版本的需求分析从而明确组员行动方向 2.指导测试人员完成高质量的测试 3.撰写主要的文档 今天完成学习一些网络编程处理ip包方面的知识,对我们的平台拓展可能有一定的帮助. linux下ip头选项ipoption的实现(难以实现,setsockopt()函数不支持BSD标准下的IP_OPTION这一关键字) 在windows下 定义ipoptionhdr结构体 typedef

2016广东工业大学新生杯决赛网络同步赛暨全国新生邀请赛 题解&amp;源码

Problem A: pigofzhou的巧克力棒 Description 众所周知,pigofzhou有许多妹子.有一天,pigofzhou得到了一根巧克力棒,他想把这根巧克力棒分给他的妹子们.具体地,这根巧克力棒长为 n,他想将这根巧克力棒折成 n 段长为 1 的巧克力棒,然后分给妹子们. 但是他妹子之一中的 15zhazhahe 有强迫症.若它每次将一根长为 k 的巧克力棒折成两段长为 a 和 b 的巧克力棒,此时若 a=b,则15zhazhahe会得到一点高兴值. pigofzhou想知

2016.2.28 DataTable用法汇总

利用视图排序 DataView dv = dtpdf.DefaultView; dv.Sort = "航路点 Asc"; gdc_pdfpnt.DataSource = dv.ToTable(); 将一个DataTable的某些行加入另一个DataTable中 2016.9.1 首先复制表结构,注意Clone和Copy的区别 DataTable prtdt = ((DataTable)gdc_zxnotmatch.DataSource).Clone();//Clone只拷贝结构,不拷贝