深度学习的相关思想

1.

感知器有一个问题,当面对的数据集不是线性可分的时候,『感知器规则』可能无法收敛,这意味着我们永远也无法完成一个感知器的训练。为了解决这个问题,我们使用一个可导的线性函数来替代感知器的阶跃函数,这种感知器就叫做线性单元。线性单元在面对线性不可分的数据集时,会收敛到一个最佳的近似上。这样替换了激活函数之后,线性单元将返回一个实数值而不是0,1分类。因此线性单元用来解决回归问题而不是分类问题。

——参考:https://www.zybuluo.com/hanbingtao/note/448086

2.

梯度是一个向量,它指向函数值上升最快的方向。

——参考《高等数学》

3.

每次更新,要遍历训练数据中所有的样本进行计算,我们称这种算法叫做批梯度下降(Batch Gradient Descent)。每次更新,只计算一个样本,称这种算法叫做SGD算法。BGD算法计算量大,SGD算法效率高。

红色是BGD的逼近曲线,而紫色是SGD的逼近曲线。由于样本的噪音和随机性,SGD每次更新w并不一定按照减少E的方向,但总体上仍然是向最低点逼近的。

随机性有时候反而是好事。目标函数是一个『凸函数』,沿着梯度反方向就能找到全局唯一的最小值。然而对于非凸函数来说,存在许多局部最小值。随机性有助于逃离某些很糟糕的局部最小值,从而获得一个更好的模型。

——参考:https://www.zybuluo.com/hanbingtao/note/448086

4.

事实上,一个机器学习算法其实只有两部分:
模型:从输入特征x预测输出y的那个函数h(x)
目标函数:训练数据中所有样本的误差的和,是w的函数
因此,如果想最简洁地介绍一个算法,列出这两个函数就行了。

——参考:https://www.zybuluo.com/hanbingtao/note/448086

N.

那么深层网络和浅层网络相比有什么优势呢?简单来说深层网络能够表达力更强。事实上,一个仅有一个隐藏层的神经网络就能拟合任何一个函数,但是它需要很多很多的神经元。而深层网络用少得多的神经元就能拟合同样的函数。也就是为了拟合一个函数,要么使用一个浅而宽的网络,要么使用一个深而窄的网络。而后者往往更节约资源。深层网络也有劣势,就是它不太容易训练。简单的说,你需要大量的数据,很多的技巧才能训练好一个深层网络。这是个手艺活。

——参考:https://www.zybuluo.com/hanbingtao/note/433855

原文地址:https://www.cnblogs.com/ratels/p/11419001.html

时间: 2024-10-08 20:22:28

深度学习的相关思想的相关文章

(转)深度学习前沿算法思想

深度学习前沿算法思想 本文转自: https://mp.weixin.qq.com/s?__biz=MzA5NDExMTAzNA==&mid=2649981646&idx=2&sn=8fe05eac5a5068efb65ca1602e5fd3a0&chksm=8854b69bbf233f8db5dbaa1ea8396d181c9a35e760ab3c1c4934b504f69fe92683972d78d327&mpshare=1&scene=2&sr

机器学习、深度学习的相关资料

下面对查阅学习机器学习.深度学习过程中搜集到的一些比较好的资料整理如下,与大家分享,如果有朋友有更好的资料,也请告诉我,谢谢大家 课程资料 coursera上的台大<机器学习技法> coursera上的台大<机器学习基石> 多伦多大学的<Neural Networks for Machine Learning>

深度学习模型相关知识(2)

参考:https://blog.csdn.net/lanran2/article/details/60143861 ROI pooling: ROI是Regin of Interest的简写,指的是特征图上的框,特点在于输入特征图尺寸不固定,但是输出特征图尺寸固定. 这里加一个Fast RCNN和Faster RCNN在ROI步骤前的区别: 1)在Fast RCNN中,RoI是指Selective Search产生的候选框在特征图的映射 2)在Faster RCNN中,RoI是由RPN产生的候选

深度学习一(相关资料)

原文地址:http://blog.csdn.net/hjimce/article/details/45421595 作者:hjimce 一.学习清单 1.综合类 (1)收集了各种最新最经典的文献,神经网络的资源列表:https://github.com/robertsdionne/neural-network-papers  里面包含了深度学习领域经典.以及最新最牛逼的算法,如果把这个列表学过一遍,基本已然达到了大神级别. (2)机器学习学习清单:https://github.com/ujjwa

深度学习:从头设计一个TensorFlow3一样的新一代深度学习系统,到底需要把握哪些要点?

深度学习工具潮流滚滚,各种工具层出不穷.也有各种文章从易用性,可移植性,灵活性和效率方面对于各个系统进行比较.这篇文章希望从系统设计上面来讲来回答这个讨论这个问题:如果想到从头设计一个TensorFlow3一样的新一代深度学习系统,到底需要把握哪些要点. 计算单元:从layer abstraction到operator 大家熟悉的第一代深度学习系统,以cuda-convnet21和caffe为代表.这些系统主要的一大特点是提出了一个以深度学习计算层次layer为基本单元的计算单位.不同的laye

一箭N雕:多任务深度学习实战

1.多任务学习导引 多任务学习是机器学习中的一个分支,按1997年综述论文Multi-task Learning一文的定义:Multitask Learning (MTL) is an inductive transfer mechanism whose principle goal is to improve generalization performance. MTL improves generalization by leveraging the domain-specific inf

【转载】机器学习——深度学习(Deep Learning)

机器学习——深度学习(Deep Learning) 分类: Machine Learning2012-08-04 09:49 142028人阅读 评论(70) 收藏 举报 algorithmclassificationfeaturesfunctionhierarchy Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得. Key Words:有监督学习与无监督学习

机器学习——深度学习(Deep Learning)

Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得. Key Words:有监督学习与无监督学习,分类.回归,密度估计.聚类,深度学习,Sparse DBN, 1. 有监督学习和无监督学习 给定一组数据(input,target)为Z=(X,Y). 有监督学习:最常见的是regression & classification. regression:Y是实数vec

深度学习基础阶段

IDH_1000=1.1 课程介绍 & 机器学习介绍.html ; Evernote ExportIDH_1001=1.2 深度学习(Deep Learning)介绍.html ; Evernote ExportIDH_1002=2 基本概念 (Basic Concepts).html ; Evernote ExportIDH_1003=3.1 决策树(decision tree)算法.html ; Evernote ExportIDH_1004=3.2 决策树(decision tree)应用