2016-03-09-阅读笔记: dump text + report on MS ResNet + Deep feeling about DL

1, 2014年的短文,今日看来无趣; link = here

2,  关于ultra-deep network,a newsletter to KaiMing He‘s 152 layers ResNet on ImageNet

LINK = here

之前理解就是在imagenet上的分类准确率事最高的,但是现在看到新的描述:

“Microsoft‘s new neural network is as good as the other networks at spotting what‘s in the photo (which is often better than an untrained human at telling the difference between two very similar breeds of dog, which is one of the tests), but it‘s twice as good at working out where in the photo it needs to look.”

文中指出训练当中feedback的损失是训练的难点,简单回顾一下训练过程,前向 + 后向传导:

"The way these things learn is you feed data into the lowest layers of the network, the signals propagate to the top layer and then you provide feedback as to whether the learning was good or not,"

“ The reinforcement signal is sent back down through the layers. The problems has been, those signals would get exceedingly weak after just a few layers, so you don‘t get any correction into the lower layers. It‘s been a huge limiting factor.”

如果设想能够对于每一层,使用某种链接方式使得各个layers近乎同时拿到所有的反向更新/feedback,那么这样可以确保bp 过程的有效进行(消除了之前所述的feedback signal衰减甚至失效的问题);但是这只是理想方法,具体操作还是存在苦难;

现在一种变通的方式就是在反向传导中忽略掉某些layers,更准确的说像是 短路掉:

Instead, the idea the team came up with was "to organise the layers so that instead of flowing through every layer, the signals can skip several layers to get to the lower layers in the network

借助在residual learning network上的成功,ms接下来的思路分为两类:

a,“Going deeper is just one way [to get better results]“

b,“parallel training, so we train the whole system across the machine, where each machine might have four or eight GPUs, so we can train even deeper networks in parallel.“

3, LINK = here

这个可以看作是Carlos同学对于deep learning的吐槽了,就是知其然,不知其所以然。

问题还是在于深度学习的理论基础的缺失;

吐槽归吐槽,作者在文中提到的其进阶过程还是蛮有意思,给出的链接值得看看,现在也准备再次enrool coursera上的课程,奋进吧,骚年。

时间: 2024-08-12 07:09:28

2016-03-09-阅读笔记: dump text + report on MS ResNet + Deep feeling about DL的相关文章

2017/03/09学习笔记

加密分为:对称加密和非对称加密对称加密:加密的秘钥和解密的密钥一样运算速度快,适合做大数据加密,强度弱eg :des 3des AES196 512....非对称加密:加密的密钥和解密的密钥不一样.运算速度慢适合做小数据加密,强度大 安全eg:rsa1024 2048 ECC椭圆曲线(SM系列)加密三要素:明文 密文 密钥 散列 哈希(指纹)(不可逆) 对称加密的原理:分组(按密钥长度分组,最后以加密 padding方式打补丁)

03构建之法阅读笔记之一

构建之法阅读笔记03 遇到问题总是想弄清楚所有细节.所有依赖关系之后再动手,想的太多,没法前进,分析的就会出现错乱,或者直接动手,慢慢发现偏离的一开始的轨道,忘记了目标,这样就会产生"分析麻痹"和"不分主次,想解决所有问题",以后遇到问题应该时刻记住自己的目标,在解决问题的时候不断提醒自己,应该如何思考.越早对自己有一个清晰的定位,对自己越好,很多人只是把软件工程师当成一个工作,当成一个能挣钱养家的营生,而我想把它的当成自己投身的事业,把软件项目相关的目标作为长期的

03软件构架实践阅读笔记之三

在上一次的阅读笔记当中,提到了很多关于软件构架的东西,例如:软件构架的周期性等,但是大部分的都是系统的说明,现在,下面看的都是详细的介绍. 在刚开始是构架的产生:在刚开始的第一句话就说:"构架也是若干商业和技术决策的结果",从这句话就可以看出构架对于软件技术的重要性,而正如我们所知道的不管什么事情都会受很多因素的干扰,同样的,架构会受系统涉众的影响,在上一学期,老师就提到了什么是涉众.但是每一种的涉众对于软件的要求就会不相同例如 客户涉众:要求成本低.及时交互.不要改动的太平凡等等:

Percona XtraBackup User Manual 阅读笔记

XtraBackup XtraBackup.. 1 2 安装XtraBackup.. 1 2.1 安装XtraBackup binary版本... 1 2.1.1 yum的安装方法:... 1 2.1.2 直接下载rpm包安装... 1 3 XtraBackup使用手册... 1 3.1 使用innobackupex脚本... 1 3.1.1 备份预备工作... 1 3.1.2 全备和全备还原... 1 3.1.2.1 使用innobackupex创建全备... 1 3.1.2.2 使用inno

CI框架源码阅读笔记3 全局函数Common.php

从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap引导文件都会最先引入全局函数,以便于之后的处理工作). 打开Common.php中,第一行代码就非常诡异: if ( ! defined('BASEPATH')) exit('No direct script access allowed'); 上一篇(CI框架源码阅读笔记2 一切的入口 index

2016年秋季阅读个人计划

制定本学期的阅读计划,并列举出每份读后感的发表日期 精读书目<掌握需求过程> 本书共14章,根据时间和个人因素,大约一周读一章,准备12月中旬读完 阅读笔记发表日期 (1)2016.10.09 (2)2016.10.23 (3)2016.11.07 (4)2016.11.19 (5)2016.11.30 (6)2016.12.13

Hadoop阅读笔记(三)——深入MapReduce排序和单表连接

继上篇了解了使用MapReduce计算平均数以及去重后,我们再来一探MapReduce在排序以及单表关联上的处理方法.在MapReduce系列的第一篇就有说过,MapReduce不仅是一种分布式的计算方法,更是一种解决问题的新思维.新思路.将原先看似可以一条龙似的处理一刀切成两端,一端是Map.一端是Reduce,Map负责分,Reduce负责合. 1.MapReduce排序 问题模型: 给出多个数据文件输入如: sortfile1.txt 11 13 15 17 19 21 23 25 27

《领域驱动设计》阅读笔记 第1章 消化知识

ddd小白,一篇章节便能激起了心中涟漪,感慨之初,记于笔下. 第1章  消化知识 用醍醐灌顶.茅塞顿开来形容此章短短的文字,实不为过. 简单介绍背景:旅游互联网,B2B,初创公司.产品设计-代码开发的衔接有过两种明显形式: 1. 项目的推进由产品部起头,收集.分析.过滤需求,形成原型文档(word,excel,visio,axure),提交CTO.CEO评审(整个产品90%的原型.流程.字段),交付开发.测试工程师. 开发工程师花一两天理解.讨论原型文档,而后建立数据库表,开撸代码,按模块交付测

Hadoop阅读笔记(六)——洞悉Hadoop序列化机制Writable

酒,是个好东西,前提要适量.今天参加了公司的年会,主题就是吃.喝.吹,除了那些天生话唠外,大部分人需要加点酒来作催化剂,让一个平时沉默寡言的码农也能成为一个喷子!在大家推杯换盏之际,难免一些画面浮现脑海,有郁闷抓狂的,有出成果喜极而涕的,有不知前途在哪儿的迷茫与不安……总的来说,近一年来,不白活,不虚度,感触良多,不是一言两语能说得清道的明的,有时间可以做个总结,下面还是言归正传谈技术吧. 上篇在了解了Hadoop的目录和源码结构后,说好的要啃源码的,那就得啃.也感谢一直以来关注我.支持我的网友