本文章是根据自己个人的理解,不足之处请指正。 本文可以给一些新手入门之人以参考。
先上图(可以点击图片看大图比较清晰):
下面是我对深度学习的个人理解,讲到哪算到哪,且我习惯讲的比较白话,比较通俗。 基本不涉及专业术语和数学。深度学习是机器学习的分支,机器学习源于数学统计。 在当下这个环境深度学习基本是深度神经网络学习的代名词或者缩略语。 目前深度学习比较成熟的领域是图像识别(车牌,人脸),声音输入输出(翻译),文本(分类)等。
深度神经网络的深度就是多层的概念, 所以这个深度两字比较高大上, 多层更加通俗。 最基本的神经网络就是:输入层,隐层,输出层。 一个隐层由多个神经元(感知器)组成。 一层的神经网络也可以用来做学习。 只是效果区别而已。 一个神经元的作用就是输入一堆数据,由一个函数(激活)决定输出是1还是0; 输入的数据还要经过一定处理,这个处理过程取决参数w, b 。 我们的学习目标就是得到一堆w, 这个w来保证输出1和0的正确性。 如何来评判这个计算出来的值和实际(真实)结果是否一致,或者偏差程度。 就要用损失函数(目标函数)来做裁判。 梯度下降算法就是怎么个计算得到最好的w。BP 算法就是怎么样能够高效的计算实现找到W.
简单总结上面: 神经元 -->神经层--> 神经网(含激活函数,损失函数等) + 多层-->深度神经网络
卷积网:包含卷积层的网络就算卷积网。 卷积: 就是对图像(数据)进行偏移,缩小 计算。 递归(循环)网: 循环网是把上一次的输入所得的结果,做为下一次输入的部分数据。从而在时间相关数据有较好的效果。这两个就是当下比较流行的 CNN RNN的基础。
深度学习解决的问题是当下人类不能100% 确定, 或者不能解释的问题解决。 让机器去模拟人解决。用来替换人类部分脑力劳动行为。 比如车牌识别, 人可以识别车牌, 但是用严禁的科学理论无法解释这个识别过程。同样,人类记住辨识另外一个人的人脸, 可以做到;但是无法100%解释怎么做到的。 而深度学习技术能代替人类做到这些。同样,计算机能做到,也不知道为什么做到的。 属于一个经验主义。
这在人类社会中, 很多很多的社会问题都有类似的应用价值。 比如老中医, 西医,比如社会舆论的研究等等。由于本人的
能力学识有限,只能讲的如此浅显。
最后贴两本书:
Neural Networks and Deep Learning , 老外写的那本, 有一本国内叫 神经网络与深度学习,不推荐。
深度学习(中文版) ,一本660页的书,可以当字典。 比较系统,且把算法原理讲的比较深入。