经典卷积神经网络——AlexNet

一.网络结构

　　AlexNet由5层卷积层和3层全连接层组成。

　　论文中是把网络放在两个GPU上进行，为了方便我们仅考虑一个GPU的情况。

　　上图中的输入是224×224224×224，不过经过计算(224−11)/4=54.75(224−11)/4=54.75并不是论文中的55×5555×55，而使用227×227227×227作为输入，

　　卷积层C1：处理流程为：卷积、ReLU、LRN、池化、

　　　　卷积：输入为227x227x3，使用96个11x11x3的卷积核，步长为4x4，得到FeatureMap为55x55x96

　　　　池化：3x3最大池化，步长为2，得到27x27x96的FeatureMap

　　卷积层C2: 处理流程为：卷积、ReLU、LRN、池化

　　　　卷积：输入为27x27x96，使用256个5x5x96的卷积核(padding = 2)，步长为1x1，得到FeatureMap为27*27*256

　　　　池化：3x3最大池化，步长为2，得到13x13x26的FeatureMap

　　卷积层C3: 处理流程为：卷积、ReLU

　　　　卷积：输入为13x13x256，使用384个3x3x256的卷积核(padding = 1)，，步长为1x1，得到13x13x384的FeatureMap

　　卷积层C4: 处理流程为：卷积、ReLU

　　　　卷积：输入为13x13x384，使用256个3x3x384的卷积核(padding = 1)，，步长为1x1，得到13x13x256的FeatureMap

　　卷积层C5：处理流程为：卷积、ReLU、池化

　　　　卷积：输入为13x13x256，使用256个3x3x256的卷积核，步长为1x1(padding = 1)，，得到13x13x256的FeatureMap

　　　　池化：3x3的最大池化，步长为2，得到6x6x256的FeatureMap

　　全连接层FC6: 处理流程为：全连接、ReLU、Dropout

　　　　全连接；输入为6x6x256，使用4096个6x6x256的卷积核，得到1x1x4096

　　全连接层FC7: 处理流程为：全连接、ReLU、Dropout

　　　　全连接：输入1x1x4096，使用4096个1x1x4096的卷积核，得到1x1x4096

　　输出层：第七层4096个数据与第八层1000个神经元进行全连接，输出1000个float值

二.,模型特点

　　1.ReLU Nonlinearity

　　标准L-P神经元的输出一般使用tanh或者sigmoid函数作为激活函数，这些饱和的非线性函数计算机梯度的时候要比非饱和函数max(0,x)慢得多，把非饱和线性函数成为Rectified Linear Units（ReLUs)

　　2.在两个GPU上训练

　　使用的GPU为GTX 580，内存只有3GB，使用一个GPU可能会限制训练网络的大小规模，因此使用两个GPU。　　

　　并行方案为把一半的神经元放在一个GPU上，GPU的交流仅在一些层上。比如第三层的将第二层的所有输出作为输入，但是第四层将第三层只属于同个GPU的输出作为输入。

　　3.Local Response Normalization

　　引入LRN，是为了模仿生物上，被激活的神经元抑制相邻神经元，即侧抑制，归一化的目的就是抑制，LRN借鉴侧抑制实现局部抑制。

　　其中bⁱ_x,y为归一化后的值，i表示通道的位置，x，y代表像素更新的位置

　　aⁱ_{x,y为输入值，是激活函数ReLU的输入值}

　　k，alpja，beta，n/2为自定义系数，一般设置k=2,n=5,alpha=1Xe-4,beta=0.75。

　　∑叠加方向是沿着通道方向，也就是一个点同方向的前面n/2个通道和后n/2个通道的点的平方和(n+1个点）

　　3.4Overlapping pooling

　　重叠池化有助于减少过拟合。

　　设池化的大小为zxz，步长为s，如果s<z,即每次池化都会和相邻池化有一部分重叠，称为重叠池化

三.减少过拟合操作

　　1数据增强

　　模型随机从256x256大小的原始图像中截取224x224大小的区域，同时还得到图片进行水平翻转后的镜像，相当于数据扩充了2048倍(2^(5+5+2))

　　测试时，模型会先截取一张图片的四个角加中间位置，并进行左右翻转，这样会获得10张图片，将10张图片作为预测的输入并对得到的10个预测结果求平均值，就是这样图片的预测结果。

　　2.dropout

　　在训练过程中，对全连接的神经元按照一定的概率将其暂时从网络中丢弃，暂时是指在此次训练中，被丢弃的神经元不进行前馈和BP了。

　　对于随机梯度下降来说，由于是随机丢弃，故每一个batch都是在训练一个不同的网络，这样就可以综合多个网络的训练结果。

原文地址：https://www.cnblogs.com/wengyuyuan/p/11769965.html

时间： 2024-10-10 02:49:27

经典卷积神经网络——AlexNet的相关文章

TensorFlow实战之实现AlexNet经典卷积神经网络

本文已同步本人另外一个博客(http://blog.csdn.net/qq_37608890/article/details/79371347) 本文根据最近学习TensorFlow书籍网络文章的情况,特将一些学习心得做了总结,详情如下.如有不当之处,请各位大拿多多指点,在此谢过. 一.AlexNet模型及其基本原理阐述 1.关于AlexNet 2012年,AlexKrizhevsky提出了深度卷积神经网络模型AlexNet,可以看作LeNet的一种更深更宽的版本.该模型包含了6亿3000万个连

经典卷积神经网络（LeNet、AlexNet、VGG、GoogleNet、ResNet）的实现（MXNet版本）

卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现. 其中文章详解卷积神经网络(CNN)已经对卷积神经网络进行了详细的描述,这里为了学习MXNet的库,所以对经典的神经网络进行实现~加深学习印象,并且为以后的使用打下基础.其中参考的为Gluon社区提供的学习资料~ 1.简单LeNet的实现 def LeNet(): """ 较早的卷积神经网络 :

【TensorFlow实战】TensorFlow实现经典卷积神经网络之VGGNet

VGGNet VGGNet是牛津大学计算机视觉组与Google DeepMind公司的研究员一起研发的深度卷积神经网络.VGGNet探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠3*3的小型卷积核核2*2的最大池化层,VGGNet成功地构建了16~19层的卷积神经网络.VGGNet相比于之前state-of-the-art网络结构,错误率大幅下降,并取得了ILSVRC 2014比赛分类项目的第二名和定位项目的第一名.VGGNet的结构非常简洁,整个网络都是使用了同样大小的卷积尺寸3*3

深度学习经典卷积神经网络之VGGNet

VGGNet是牛津大学计算机视觉组(VisualGeometry Group)和GoogleDeepMind公司的研究员一起研发的的深度卷积神经网络.VGGNet探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠3*3的小型卷积核和2*2的最大池化层,VGGNet成功地构筑了16~19层深的卷积神经网络.VGGNet相比之前state-of-the-art的网络结构,错误率大幅下降,并取得了ILSVRC 2014比赛分类项目的第2名和定位项目的第1名.同时VGGNet的拓展性很强,迁移到其

【TensorFlow实战】TensorFlow实现经典卷积神经网络之Google Inception Net

Google Inception Net 0.前言 Google Inception Net首次出现在ILSVRC 2014比赛中,就以较大优势获得第一名.那届的Inception Net被称为Inception Net V1,它最大的特点就是控制了计算量和参数量的同时,获得了非常好的分类性能--top-5错误率6.67%,只有AlexNet的一半不到.Inception Net V1有22层深,比AlexNet的8层或者VGGNet的19层还要更深.但其计算量只有15亿次浮点运算,同时只有50

卷积神经网络（CNN）在语音识别中的应用

卷积神经网络(CNN)在语音识别中的应用作者:侯艺馨前言总结目前语音识别的发展现状,dnn.rnn/lstm和cnn算是语音识别中几个比较主流的方向.2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(Feed Forward Deep Neural Network)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮.长短时记忆网络(LSTM,LongShort Term Memory)可以说是目前语音

深度学习——卷积神经网络的经典网络（LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet）

一.CNN卷积神经网络的经典网络综述下面图片参照博客:http://blog.csdn.net/cyh_24/article/details/51440344 二.LeNet-5网络输入尺寸:32*32 卷积层:2个降采样层(池化层):2个全连接层:2个输出层:1个.10个类别(数字0-9的概率) LeNet-5网络是针对灰度图进行训练的,输入图像大小为32*32*1,不包含输入层的情况下共有7层,每层都包含可训练参数(连接权重).注:每个层有多个Feature Map,每个Featu

卷积神经网络_(2)_分类与回归_几类经典网络简介

1.经典神经网络有:2012年提出的AlexNet和2014年提出的VGGNet,结构图分别如下: 2.分类与回归: (1)分类(classfication):就是经过经过一系列的卷积层和池化层之后,再经过全连接层得到样本属于每个类的得分,再用比如softmax分类其对其进行分类: (2)回归(regression):相当于用一个矩形框来框住要识别的物体,即localization; 如下: 这里,回归用了拟合的方法,即给定输入中物体的位置(x,yw,h),再用卷积网络的输出(x',y',w',

【卷积神经网络-进化史】从LeNet到AlexNet

[卷积神经网络-进化史]从LeNet到AlexNet 本博客是[卷积神经网络-进化史]的第一部分<从LeNet到AlexNet> 如需转载,请附上本文链接:http://blog.csdn.net/cyh_24/article/details/51440344 更多相关博客请猛戳:http://blog.csdn.net/cyh_24 本系列博客是对刘昕博士的<CNN的近期进展与实用技巧>的一个扩充性资料. 主要讨论CNN的发展,并且引用刘昕博士的思路,对CNN的发展作一个更加详细