卷积神经网络学习笔记与心得（4）池化

图片经过卷积、激活后的结果一般带有大量原图信息。

上图中卷积核提取的是竖直方向上的连续像素，但是，被增强的像素只占了结果的1/3，对于多层网络，其余重要性较低的信息也被传入了下一层网络，造成了不必要的浪费，因此需要用池化对卷基层得到的结果做聚合统计。池化的理论基础是：图像相邻位置的像素是相关的，即使间隔一段尺寸对图像进行采样，得到的结果依旧能保持大部分信息。常用的池化方式有最大池化和均值池化。池化的另一个重要作用是为卷积神经网络带来一定的平移、旋转和透视不变性。

上图展示了池化如何为模型带来平移不变性。原图中垂直方向上的一段连续像素被右移了一个单位得到了平移后的图片，两者经过尺寸为2*2，步长为1的最大池化后，得到了相同的结果。对于旋转和透视，池化也可以达到类似的效果。但池化使模型具有对平移、旋转、透视的抗性并不是没有限制的，首先池化的效果依赖于卷积的结果，如果卷积没有捕捉到上述变换后的特征，池化也失去了抗平移、旋转、透视的能力，其次，池化对上述三种变换的抗性和池化的尺寸有关，池化尺寸越大，抗性越强，但信息丢失的也越多，其中利弊需要设计者权衡。

原文地址：https://www.cnblogs.com/bugsheep/p/8470547.html

时间： 2024-11-09 13:46:01

卷积神经网络学习笔记与心得（4）池化的相关文章

卷积神经网络学习笔记与心得（3）卷积

数字图像是一个二维的离散信号,对数字图像做卷积操作其实就是利用卷积核(卷积模板)在图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值相加作为卷积核中间像素对应的图像上像素的灰度值. 从卷积的效果来看,在二维图像上进行卷积时,卷积核对所在区域上符合某种条件的像素赋予较多的权重,其他的像素赋予的权重较少,这可以看作是一种滤波行为,因此卷积神经网络的卷积核有时也被称为滤波器,卷积核所在区域被称为局部感知域.若局部感知域中存在像素符合加较大权重的条件,称这些像素具有某种特

卷积神经网络学习笔记与心得（2）数据集

机器学习领域有很多现成的数据集,它们由个人或组织制作.整理,且向外界公开下载,比如在字符识别领域有mnist数据集等,数据挖掘领域有Iris,Adult数据集等.这些数据集为相关技术研究者提供了很大的便捷,有了这些资源,研究者就可以把更多的精力放在模型的研究上,可以说这些数据集的制作整理者对推动数据挖掘和机器学习的发展做出了巨大的贡献. 不过,在不少情况下,这些数据集未必能满足我们的需求,这时就要我们自己制作数据集了.不得不说,这次的字符识别项目中制作数据集的经历着实让我感受到了那些数据整理者的

CNN卷积神经网络学习笔记2：网络结构

在上篇笔记<CNN卷积神经网络学习笔记1:背景介绍>中已经介绍过CNN的结构,这篇笔记中,通过一个简单的CNN的例子,梳理一下CNN的网络结构的细节. 以下是一个6层的CNN网络,这个简单的CNN网络是DeepLearning Toolbox里面CNN的一个例子,后面要通过DeepLearning Toolbox中CNN的代码来进一步理解CNN的整个过程.我们输入的是1张大小为28*28的图片. 需要注意的有: 1,这里输入的是一张图片,如果我们输入了50张图片,那么下图中的每一个方框(代表一

CNN卷积神经网络学习笔记3：权值更新公式推导

在上篇<CNN卷积神经网络学习笔记2:网络结构>中,已经介绍了CNN的网络结构的详细构成,我们已经可以初始化一个自己的CNN网络了,接下来就是要用训练得到一个确定的CNN的模型,也就是确定CNN的参数. CNN本质上就是人工神经网络的一种,只是在前几层的处理上有所不同,我们可以把卷积核看成是人工神经网络里的权值W,而采样层实质上也是一种卷积运算.所以可以基于人工神经网络的权值更新的方法来推导CNN里的权值更新公式.人工神经网络里是用反向传播算法将误差层层回传,利用梯度下降法更新每一层的权值,C

深度卷积神经网络学习笔记（一）

1.卷积操作实质: 输入图像(input volume),在深度方向上由很多slice组成,对于其中一个slice,可以对应很多神经元,神经元的weight表现为卷积核的形式,即一个方形的滤波器(filter)(如3X3),这些神经元各自分别对应图像中的某一个局部区域(local region),用于提取该区域的特征.如果该slice对应的神经元参数共享,那么相当于只有一个卷积核作用于所有的局部区域(类似于图像滤波了).一个局部区域可以称为一个block,如果将所有的block拉成一个个列向量(

CNN卷积神经网络学习笔记1：背景介绍

Convolutional Neural Network 卷积神经网络是基于人工神经网络提出的.人工神经网络模拟人的神经系统,由一定数量的神经元构成.在一个监督学习问题中,有一组训练数据(xi,yi),x是样本,y是label,把它们输入人工神经网络,会得到一个非线性的分类超平面hw,b(x),在这篇笔记中先梳理一下传统人工神经网络的基本概念,再基于传统人工神经网络简单介绍卷积神经网络. 1,神经元neuron 一个神经元是神经网络中的一个运算单元,它实质上就是一个函数.下图是一个神经元的示意图

个人卷积神经网络学习笔记（我的理解）

学习过程相当于使用一个滤波器,定义滤波器大小和深度步长,在原图像上滑动,滤波器上每一个深度的点对原图像上特征点响应的量化值都是不同的,响应过程是一个卷积过程,原图像如果是3 7*7(3是原来的depth),滤波器定义为10 3*3 stride=1则获得的输出为10 5*5,在学习过程中卷积层的大小会不断变小,所以针对高深度的可能会循环上千次的卷积神经网络,需要在每次输出的卷积层外加(size_of_fliter-1)的pad,来防止尺度缩减或者缩减过快的问题,针对我列举出的数据,训练一次之后的

【神经网络学习笔记】LIBSVM参数讲解

支持向量机SVM(Support Vector Machine)作为一种可训练的机器学习方法可以实现模式分类和非线性回归,本文就matlab中的LIBSVM工具箱展开说明. 在matlab中调用LIBSVM工具箱可以方便的使用LIBSVM网络,台湾大学的林智仁教授已经封装好各方法,大家可以在此下载. LIBSVM工具箱的主要函数为svmtrain和svmpredict,调用格式为 model = svmtrain(train_lable,train_data,options); [predict

卷积神经网络学习（二）

一.基础知识(一) filter: padding:在图像卷积操作之前,沿着图像边缘用0进行图像填充.padding会影响输出图像大小. stride(卷积步长):卷积步长是指过滤器在图像上滑动的距离 input: n*n, filter: f*f, stride: s, padding: p output:, ? ?表示向下取整单层卷积网络: ReLU(整流线性单位)--与Sigmoid函数不同的是,最近的网络更喜欢使用ReLu激活函数来处理隐藏层.该函数定义为: 当X>0时,函数的输出值为

猜你喜欢

malloc calloc 和 realloc

realloc()函数原型:extern void *realloc(void *mem_address, unsigned int newsize); 语法:指针名=(数据类型*)realloc( ...

mysql中文乱码（第2问）

entityengine.xml 修改红色文字地方: <datasource name="localmysql" helper-class=" ...

U-Mail邮件系统切换IP地址后该如何操作？

问:新安装的U-Mail邮件系统,已能正常运行.因与老系统切换,需要改变安装有U-Mail邮件系统软件的服务器IP地址,我试了一下,只简单地修改服务器的IP地址后还不能正常使用,在浏览器上只能看到I ...

Apache Server 添加虚拟主机（Virtual Host ）

当前许多虚拟服务器如阿里云的ECS服务器,都提供各式各样的虚拟机,常见的有Linux.Windows等,如果我们使用了Apache Server作为虚拟机的Web服务器,并且我们希望多个web应用程序 ...

（WPF）附加属性

<Window x:Class="DeepXAML.MainWindow" xmlns="http://schemas.microsoft.com/winfx/20 ...

Linux SCP 命令：利用SSH传输文件

在linux下一般用scp这个命令来通过ssh传输文件. 1.从服务器上下载文件scp [email protected]:/path/filename /var/www/local_dir(本地目录 ...

05 - @property 后面所加的关键词

——数据的存取访问方式:(readonly,readwrite):表示一个属性是可以赋值的还是只读的.默认是readwrite.一个属性只能拥有其中的一种. ——线程安全(atomic,nonatom ...

React-webpack环境配置-初步稿子

1.打开命令窗口:cmd 2.进入react项目所在文件夹:cd 项目所在路径(路径可以直接拖拽) 3.安装该项目所有的依赖包:npm install (windows系统下装依赖的话,可能会需要这个 ...

从软件开发角度，审视编码规范

本文综述:编码实践中遇到的问题总结和分析(实践总结) 1. 将单一的功能独立出来,不要将代码写成一坨坨的:功能独立出来后,能够从主程序中看出主要的逻辑(易于整理处理文档),而不是什么都看不出来. 2. ...

Visual Studio 2010 下安装RGiesecke.DllExport

RGiesecke.DllExport 在 UnmanagedExports 中.安装过程如下: 1.首先在"工具"菜单下的"扩展管理器"中,安装 NuGet ...

[转]Markdown 语法说明 (简体中文版)

NOTE: This is Simplelified Chinese Edition Document of Markdown Syntax. If you are seeking for Engli ...

$.ajax与$.post、$.get的一点区别

后台代码: [HttpPost] public string DoLogin(string username,string password) { return "success" ...

Ajax ：六个全局事件

加载请求: .ajaxStart() 和 .ajaxstop() $(document).ajaxStart(function(){ $('.loading').show(); }).ajaxStop ...

android中NavigationDrawer的使用以及添加drawer切换时的动画效果

最近在开发app的时候需要用到NavigationDrawer,但是在添加动画(汉堡图标和箭头图标互转)效果的时候老是出现问题,折腾了好几个小时终于搞定.在这里跟大家分享一下.说明下,我开发时候用的m ...

windows2008批量建立用户账号的方法

(1)新建一个文本文档,写上命令,完成后点击文件,选择文件,选择另存为, 类型选择所有文件,文件后缀名为bat格式.

并查集 poj2236

网址:http://poj.org/problem?id=2236 题意:有n台坏的电脑,如果每两台电脑的距离不能超过d,那么这两台电脑有联系,用字符串O 表示标记第x台电脑维修了,用S判断从X到y是 ...

ListView与GridView异步加载图片

原理很简单,主要是用到了回调方法,下面是异步加载图片的类 <span style="font-size:16px;">package com.xxx.xxx; impo ...

寻找EBS 11i Mtl_Item_Categories

背景: 这两天在做客户化物料编码导入的功能,发现请求运行完毕后,竟然警告了!"Warning : Validation Errors Occured. Please check MTL_IN ...

matlab的figure窗口命名为中文

figure('NumberTitle', 'off', 'Name', '我的窗口名字');

【mongoDB】学习笔记_01

MongoDB 简介简介 MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的.它支持的数据结构非常松散,是类似 json 的 bson 格式 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.