SIGAI深度学习第七集 卷积神经网络1

讲授卷积神经网络核心思想、卷积层、池化层、全连接层、网络的训练、反向传播算法、随机梯度下降法、AdaGrad算法、RMSProp算法、AdaDelta算法、Adam算法、迁移学习和fine tune等。

大纲:

卷积神经网络简介

视觉神经网络的核心思想

卷积神经网络的核心思想

卷积运算

卷积层的原理

多通道卷积

池化层的原理

全连接层

卷积网络结构

训练算法简介

卷积层的反向传播

池化层的反向传播

全连接层的反向传播

完整的反向传播算法

随机梯度下降法

参数值初始化

学习率的设定

梯度下降法的改进

迁移学习与fine tune

本集总结

卷积神经网络简介:

是各种深度神经网络中被使用最广泛的一种,由LeCun在1989年提出(1998年又设计了LetNet5网络),被成功应用于手写字符图像的识别(如邮政编码识别)。

在这之后的很长时间内,卷积网络没有得到广泛关注和大规模应用,到2012年,有更深层次的AlexNet网络在图像分类(如人脸检测、物体识别)任务中取得成功,此后卷积神经网络高速发展,被广泛用于机器视觉等领域,在很多问题上都取得了当前最好的性能。在上世纪90年代,1995~2012,机器视觉里边很多问题,都是用SVM、AdaBoost来做的,如检测和各种分类问题,比卷积神经网络效果好一些,随着大量的样本的出现及算法本身的改进、GPU计算技术的出现,导致卷积神经网络精度越来越高,对很多问题解决效果越来越好,因此成为解决现实问题的一个方案。

通过卷积和池化层自动学习图像在各个尺度上的特征。

是一种仿生的方法,借鉴自动物的视觉神经网络系统。

视觉神经系统的原理:

人在认知图像时是分层进行的,首先理解的是颜色和亮度,然后是边缘、角点、直线等局部细节特征,接下来是纹理、形状、区域等更复杂的信息和结构,最后形成整个无图的概念。

视觉神经科学之前对于视觉机理的研究已经证明了大脑的视觉皮层具有分层结构,对应于对图像理解时一层层的分层结构。

眼睛将看到的物体成像在视网膜上,视网膜把光学信号转换成电信号,传递到大脑的视觉皮层(Visual cortex),视觉皮层是大脑中负责处理视觉信号的部分。

卷积神经网络的核心思想:

卷积神经网络可以看成是对视觉神经系统机制的简单模仿。

由卷积层、池化层、全连接层构成,通过多个卷积、池化层提取图像在各个尺度上的特征。

每个卷积层包含多个卷积核,用这些卷积核从左向右、从上往下依次扫描整个图像,得到称为特征图(feature map)的输出数据。

网络前面的卷积层捕捉图像局部、细节信息,有小的感受野,即输出图像的每个像素只对应输入图像很小的一个范围;后面的卷积层感受野逐层加大,用于捕获图像更复杂、更抽象的信息。

经过多个卷积层的运算,最后得到图像在各个不同尺度的抽象表示。

卷积运算:

在数字图像处理领域,卷积是一种常见的运算。

可用于图像去噪、增强、边缘检测等问题,还可以用于提取图像的特征。

用一个称为卷积核的矩阵自上而下、自左向右在图像上滑动,将卷积核矩阵的各个元素与它在图像上覆盖的对应位置的元素相乘,然后求和,得到输出值。

原文地址:https://www.cnblogs.com/wisir/p/11737201.html

时间: 2024-11-09 00:44:28

SIGAI深度学习第七集 卷积神经网络1的相关文章

SIGAI深度学习第十集 卷积神经网络4

大纲 应用简介人脸检测人脸识别通用目标检测图像分割风格迁移总结 讲述CNN典型应用,主要是在机器视觉领域里边,这是它应用最广的一个领域,包含下边几个应用:人脸识别:人脸检测:通用目标检测:图像分割:风格迁移. 检测.分类.分割基本上已经涵盖了图像理解的整体上要完成的一个目标,我们对所有图像的理解无非就是这三类问题:图像分类(判断一个图像它是什么).目标检测(找出图像里边所有的目标,包括它的大小和位置).图像分割(确定每个像素它属于哪一个目标). 卷积神经网络应用简介 先简单介绍一下CNN的应用情

吴恩达【深度学习工程师】 04.卷积神经网络 第四周特殊应用(2)神经风格转换

该笔记介绍的是<卷积神经网络>系列第四周:特殊应用(2)神经风格转换 主要内容有: 1.神经风格转换 2.卷积网络隐藏单元可视化显示 3.神经风格转换代价函数 4.内容代价函数 5.风格代价函数 *6.数据从一维到三维的推广 神经风格转换 把C(content)内容图片转化为风格类似S(style)风格图片的G(generated)生成图片. 卷积网络隐藏单元可视化显示 通过观察可视化显示的不同隐藏单元的输出结果真正了解卷积网络中深度较大的层真正在做些什么. 可视化图块输出: 从第一层隐藏层第

吴恩达【深度学习工程师】 04.卷积神经网络 第三周目标检测 (1)基本的对象检测算法

该笔记介绍的是<卷积神经网络>系列第三周:目标检测(1)基本的对象检测算法 主要内容有: 1.目标定位 2.特征点检测 3.目标检测  目标定位 使用算法判断图片中是不是目标物体,如果是还要再图片中标出其位置并使用边框标记出来                          我们研究过的问题中,图片分类的思想可以帮助学习分类定位,而分类定位的思想又可以帮助学习对象检测 a.分类定位问题,通常有一个较大的对象位于图片中间位置. b.对象检测问题,图片可以含有多个对象,或一张图片中会有多个不同分

TensorFlow深度学习实战---图像识别与卷积神经网络

全连接层网络结构:神经网络每两层之间的所有结点都是有边相连的. 卷积神经网络:1.输入层 2.卷积层:将神经网络中的每一个小块进行更加深入地分析从而得到抽象程度更高的特征. 3 池化层:可以认为将一张分别率较高的图片转化为分别率较低的图片,通过池化层,可以进一步缩小最后全连接层中节点的个数,从而达到减少整个神经网络中参数的目的. 4全连接层:可以认为图像中的信息已经被抽象成了信息含量更高的特征. 5 softmax层 循环神经网络 原文地址:https://www.cnblogs.com/bju

SIGAI深度学习第六集 受限玻尔兹曼机

讲授玻尔兹曼分布.玻尔兹曼机的网络结构.实际应用.训练算法.深度玻尔兹曼机等.受限玻尔兹曼机(RBM)是一种概率型的神经网络.和其他神经网络的区别:神经网络的输出是确定的,而RBM的神经元的输出值是不确定的,以某种概率取到某一个值.以另一种概率取到另一个值,神经元的输出值.各个神经元的输入值服从某种概率分布,所有神经元的输出值服从玻尔兹曼分布. 大纲: 玻尔兹曼分布 网络结构 计算隐藏单元的值 用于特征提取 训练算法 深度玻尔兹曼机 本集总结 玻尔兹曼分布: 玻尔兹曼分布是统计物理中的一种概率分

机器学习和深度学习资料合集

机器学习和深度学习资料合集 注:机器学习资料篇目一共500条,篇目二开始更新 希望转载的朋友,你可以不用联系我.但是一定要保留原文链接,因为这个项目还在继续也在不定期更新.希望看到文章的朋友能够学到更多.此外:某些资料在中国访问需要梯子. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <Deep Learning in

对比《动手学深度学习》 PDF代码+《神经网络与深度学习 》PDF

随着AlphaGo与李世石大战的落幕,人工智能成为话题焦点.AlphaGo背后的工作原理"深度学习"也跳入大众的视野.什么是深度学习,什么是神经网络,为何一段程序在精密的围棋大赛中可以大获全胜?人工智终将会取代人类智慧吗? <神经网络与深度学习>是一本介绍神经网络和深度学习算法基本原理及相关实例的书籍,它不是教科书,作者已尽量把公式减少到最少,以适应绝大部分人的阅读基础和知识储备.<神经网络与深度学习>涵盖了神经网络的研究历史.基础原理.深度学习中的自编码器.深

深度学习算法实践10---卷积神经网络(CNN)原理

其实从本篇博文开始,我们才算真正进入深度学习领域.在深度学习领域,已经经过验证的成熟算法,目前主要有深度卷积网络(DNN)和递归网络(RNN),在图像识别.视频识别.语音识别领域取得了巨大的成功,正是由于这些成功,能促成了当前深度学习的大热.与此相对应的,在深度学习研究领域,最热门的是AutoEncoder.RBM.DBN等产生式网络架构,但是这些研究领域,虽然论文比较多,但是重量级应用还没有出现,是否能取得成功还具有不确定性.但是有一些比较初步的迹象表明,这些研究领域还是非常值得期待的.比如A

吴恩达深度学习:1.2什么是神经网络

写在开头的话,本博客内容全部来自吴恩达深度学习教学课程,插图均来自吴恩达课件,在此说明来处,不喜勿喷! 一.什么是神经网络 1.我们从一个房屋加个预测的例子开始,假设有一个6间房间的数据集,已知房屋的面积单位是平方米或者平方英尺,已知房屋加个,现在想要找到一个函数,根据房屋面积来预测房屋价格的函数.如果有机器学习的只是,可以用线性回归得到这样的一条直线: 但是我们知道,价格永远不可能为一个负值,所以用一个直线的线性回归进行预测不太合适,我们可以在size轴将预测线弯曲一点,让他结束于0,我们所要