2016.3.28 其他的调整网络的技巧

其他的调整网络的技巧

技巧有很多，但是简单常用的不多。

首先说说对于随即梯度下降的不同变换，梯度下降其实就是用c来对于单独的一个w进行变换，但是我们如果考虑到对于不同的两个或者更多的w之间的关系呢？实际上就是用c对于多个w求多个偏导数。

Momentu就是二阶导数，原来的学习是使用c直接对于w进行修改，但是现在相当于多了一个屏障。原来走的每一步的步长实际上是和c直接相关的，但是通过momentum，加了一个代理，就是c调整一个中间的变量，中间变量再修改整体的w的值，所以再这样的情况下能够非常好的实现一个控制。

比如说我们想象一辆行驶的汽车，原来的w和c直接相关，可能一不小心就走多了，因为我们需要超像某个方向，方向是由c对w求偏导来决定的，走多少是学习率来决定的。但是这个带来的一个问题就是到底参数互相之间什么关系，要不要也微微调整以下。

其实这个也没太理解。

再有就是如何去最小化损失函数：

conjugate gradient descent ， BFGS ，或者nesterov’s
accelerate gradient technique。

Sigmoid能不能换呢？其实tanh也许更好，因为对于sigmoid来说，激活的都是大于0的，这就意味着如果某个神经元是某个值，那么和这个相连的前一层的结果就都是同时增加或者减少的。而且tanh其实是sigmoid的一个缩放。还有一个比较神奇的东西就是relu（rectified linear unit）。

我们还没有明确的知道为什么这些是管用的，不过我们会继续探索。

下面问题来了：

1. 到底怎么解释这些，为什么激活函数这个就可以，有没有更好的？哪个是最好的？还是和数据有关？

时间： 2024-12-25 20:17:01

2016.3.28 其他的调整网络的技巧的相关文章

Murano Weekly Meeting 2016.06.28

Meeting time: 2016.June.28 1:00~2:00 Chairperson: Kirill Zaitsev, from Mirantis Meeting summary: 1.Action Item Review Action: Nikolay_St kzaitsev_mb draft a spec with all the options we have considering swtiching from glance v1 to glance v2 Action:

最详尽的PS色相调整最实用技巧介绍

这张图里的数字是经过我改过的,主要就是为了方便大家理解.是为了和色相调节相匹配.这里的数值相当于色相的数值.-180--0--180.和这张图的角度相对应.这张图可以看成每两个颜色之间相差60度.QANDA.REN计算机学习干货:PS色相调整最实用技巧介绍首先,做一个试验,新建一个图层,Ctrl+J复制图层,一般复制一下图层会比较安全,最好养成习惯.绘制三种颜色的矩形框.分别填充红色(R=255 G=0 B=0).绿色(R=0 G=255 B=0).蓝色(R=0

2016年pmp考试大纲调整

本次改版,主要着力于更新最近一次角色描述研究(RDS)所提供的"对于项目管理专业人士角色"的新兴描述.该项研究,基于最近对全球PMP持证者的问卷调查,收集到PM在领域.任务.知识.技能各个版块的新兴现状.从各行业.各工作岗位.各地区的项目管理实践者的视角,更新了PMP考试的部分基础信息,以确保PM考试的与时俱进与实操可行性.改版内容覆盖PMP学习内容的五大领域.其中,在项目启动领域新增3个知识点,在项目计划领域新增1个知识点,在项目执行领域新增2个知识点,在项目监视与控制领域新增2个知

【2016.11.28】纯HTML仿微博注册页面

效果如图代码 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>新浪微博</title> </head> <body bgcolor="#BEE1F5"> <table align="center" width="896" height="186

2016.3.28 如何去确定初始参数

如何去确定初始参数有那么多参数,比如说学习率yita,惩罚的大小lambda,以及mini-batch还有网络什么时候停止. 一个比较宏观的思路是为了验证想法,没有必要用全部的数据集,而是采用其中的一部分,验证有效了,再去使用更大的数据集合,而且为了验证想法,可以适当的减小网络的层的深度,而且做更频繁的validation,其实就是相当于做快速的小实验,能够更快的训练网络,看到想法的效果. 所以这样的想法在实验时候非常有效.记住:使用小网络进行小样本的测试. 那么对于学习来说,到底什么样的参数

2016/8/19 Linux常用命令 : 网络命令、关机重启命令

1.给用户发送信息:write ,以Crtl + D 结束 write 用户名 2.发广播信息:wall wall [message] 3.测试网络连通性:ping ping 选项 IP地址 -c 指定发送次数范例:ping 192.168.1.102 4.查看和设置网卡信息:ifconfig ifconfig 网卡名称 IP地址范例:ifconfig eth0 192.168.1.102 5.查看发送电子邮件:mail mail [用户名] 6.列出目前与过去登入

软件工程 2016.6.28 日报

今天,通过调查表的反馈明确了改进方向.作为组长,我负责整个项目的进度管理和质量控制,10天里的主要方向是: 1.不断进行新版本的需求分析从而明确组员行动方向 2.指导测试人员完成高质量的测试 3.撰写主要的文档今天完成学习一些网络编程处理ip包方面的知识,对我们的平台拓展可能有一定的帮助. linux下ip头选项ipoption的实现(难以实现,setsockopt()函数不支持BSD标准下的IP_OPTION这一关键字) 在windows下定义ipoptionhdr结构体 typedef

2016广东工业大学新生杯决赛网络同步赛暨全国新生邀请赛题解&源码

Problem A: pigofzhou的巧克力棒 Description 众所周知,pigofzhou有许多妹子.有一天,pigofzhou得到了一根巧克力棒,他想把这根巧克力棒分给他的妹子们.具体地,这根巧克力棒长为 n,他想将这根巧克力棒折成 n 段长为 1 的巧克力棒,然后分给妹子们. 但是他妹子之一中的 15zhazhahe 有强迫症.若它每次将一根长为 k 的巧克力棒折成两段长为 a 和 b 的巧克力棒,此时若 a=b,则15zhazhahe会得到一点高兴值. pigofzhou想知

2016.2.28 DataTable用法汇总

利用视图排序 DataView dv = dtpdf.DefaultView; dv.Sort = "航路点 Asc"; gdc_pdfpnt.DataSource = dv.ToTable(); 将一个DataTable的某些行加入另一个DataTable中 2016.9.1 首先复制表结构,注意Clone和Copy的区别 DataTable prtdt = ((DataTable)gdc_zxnotmatch.DataSource).Clone();//Clone只拷贝结构,不拷贝

猜你喜欢

2017年8月14日套题记录 | 普及组

写在前面今天登洛谷发现离Noip剩下88天了??(虽然看起有点久),然后觉得似乎水了一个暑假什么也没做(虽然学了点数据结构和一些奇奇Gaygay的东西),于是打开题库发现去年Long Happy的集 ...

用户故事与敏捷开发读书笔记01

软件需求是一个软件项目成功的关键因素,许多软件项目失败都是因为软件需求的“不完整.不准确.不一致”.而软件需求是从业务需求经用户需求最终得到系统需求的,所以业务需求是软件需求的源头,而业务需求又是从客 ...

ubuntu 14.04 以root权限启动chrome

chrome版本 51.0.2704.103 How to run google chrome as root in linux - Unix & Linux Stack Exchange提示 ...

Android 获取软键盘的删除delete事件

对于软键盘删除事件,网上有很多方案是如下,但是 google api也说明了,这个只是监听硬件键盘,对于软键盘并不负责触发(我测试了一下,软键盘能够监听delete键,其他键像数字字母等没有触发这里的 ...

Pangolin的使用

Pangolin 是一个可用于SLAM可视化的openGL库.目前有很多SLAM系统都用它作为可视化的工具.它的编译与安装过程问题不大,依赖也比较少.但最近我在单独使用它的时候,碰到了很奇怪的现象:我 ...

mac ruby rails安装（使用rvm）

mac的场合: which ruby -> /usr/bin/ruby -> 这是mac自带的ruby,我们希望能用管理ruby的版本. 安装rvm curl -L https://get ...

[LeetCode] Pow(x, n) 二分搜索

Implement pow(x, n). Hide Tags Math Binary Search 题目很简单的. class Solution { public: double pow(double ...

Mybatis学习笔记之一——牛刀小试

1.Mybaits核心对象SqlSession的作用: (1)向SQL语句传入参数: (2)执行SQl语句: (3)获取执行SQL语句的结果: (4)事务的控制: 2.核心配置文件(Configrat ...

iOS开发UI篇----UI基础之Tom猫动画

#import "ViewController.h" @interface ViewController () @property (weak, nonatomic) IBOutl ...

Android Handler 消息循环机制

前言一问起Android应用程序的入口,很多人会说是Activity中的onCreate方法,也有人说是ActivityThread中的静态main方法.因为Java虚拟机在运行的时候会自动加载指定 ...

微信张小龙、搜狗王小川遥相呼应的两个人

张小龙,腾讯系最杰出最有影响力的大神级产品经理:王小川,搜狐系最杰出最有影响力的大神级产品经理.当张小龙遇上王小川,一切都变得备受期待,而实际上,这两个人正在遥相呼应. 刨去腾讯与搜狐的体量不谈,张小 ...

Citrix桌面虚拟化 技术方案建议书

Citrix桌面虚拟化- -技术方案建议书北京四通管理软件有限责任公司二〇一〇年五月目录一.方案背景. 3 二.Citrix技术方案. 5 2.1.技术架构. 8 2.2.虚拟化系统概要介绍. ...

程序员如何哄女朋友开心的秘籍,定制给女朋友一个应用(生日礼物)

这算是我写的安卓比较完整的一个应用了吧,不过其实也还不怎么完整,还有好多功能没有加进去,但是由于昨天是女朋友的生日,所以就送给他了,这也是我学习安卓半个月来的第一个应用了"音乐播放器&quo ...

PHP生成随机或者唯一字符串

本文出至:新太潮流网络博客 /** * [生成随机字符串] * @E-mial [email protected] * @TIME 2017-04-07 * @WEB http://blog.iinu ...

form表单标签及属性的介绍

版权声明:本文为博主原创文章,未经博主允许不得转载. 一. 表单标签 <form></form> 常用属性 Action 跳转到什么页面 Method 以什么模式提交 Get ...

裁剪UI Image 矩形四角圆形 Shader

Shader "Custom/CullImage" { Properties{[PerRendererData] _MainTex("Sprite Texture&quo ...

那些奋斗的历程之年终总结

不知不觉间,2014过去了,回顾这一年来,突然发现原来自己接受到了好多东西,一些自己从来都不敢想的东西. 翻看自己的今目标,原来自己已经经历过好多项目了: 虽然这些项目相对于那些大型的项目来说有点微不 ...

slowsloris代码

#!/usr/bin/perl -wuse strict;use IO::Socket::INET;use IO::Socket::SSL;use Getopt::Long;use Config; $ ...

同义词解析 (categorize classify)

两者在中文中都有分类的意思,具体区别我查了半天还是有点迷糊,有一个比较简单的说法 1. categorize 的含义是分成不同的小组,一般有按照功能分类的含义 Lindsay, like his fi ...

Spring MVC-控制器（Controller）-多动作控制器（Multi Action Controller）示例（转载实践）

以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_multiactioncontroller.htm 说明:示例基于Spring M ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.