深度学习的数学基础

微积分
- 无穷小
  在17世纪下半叶，数学史上出现了无穷小的概念，而后发展处极限的概念
- 极限
  - 数列的极限
  - 函数的极限
- 导数
- 微分
- 积分
  - 不定积分
    也称为原函数或反导数
  - 定积分
  - 定积分中值定理
- 牛顿-莱布尼茨公式
- 偏导数
概率统计
- 样本空间
  定义：随机试验 E 的所有结果构成的集合称为 E 的样本空间，记为 S={e}
  称 S 中的元素 e 为样本点，一个元素的单点集称为基本事件．
- 概率
  条件概率/后验概率
  P（A|B）
  边缘概率/先验概率
  A的边缘概率表示为P（A）,B的边缘概率表示为P（B）
  联合概率
  全概率公式
  贝叶斯公式
- 随机变量
  离散型随机变量
  对离散随机变量用求和得全概率
  定义
  (0-1)分布/两点分布/伯努利分布
  二项分布
  泊松分布(Poisson分布)
  连续型随机变量
  对连续随机变量用积分得全概率
  概率分布函数F(x)
  概率密度函数f(x)
  均匀分布
  X~U（a，b）
  指数分布
  正态分布/高斯分布
  是研究误差分布的一个理论
- 期望
  离散型随机变量的期望
  连续型随机变量的期望
- 方差(Variance)
  一个随机变量的方差（ Variance ）描述的是它的离散程度，也就是该变量离其期望值的距离
  标准差(Standard Deviation)
  方差的算术平方根称为该随机变量的标准差。
  样本标准差
  协方差
  相关系数(Correlation coefficient)
  协方差矩阵
  主成分分析(PCA)
  在统计学中被称为主成分分析 (principal components analysis ，简称 PCA) ，在图像处理中称为 Karhunen-Loève 变换 (KL- 变换 ) 。
- 大数定律
  大数定律负责给出估计——期望
- 中心极限定理
  中心极限定理负责给出大数定律的估计的误差——标准差乘以标准正态分布
  大量相互独立的随机变量，其均值（或者和）的分布以正态分布为极限（意思就是当满足某些条件的时候，比如 Sample Size 比较大，采样次数区域无穷大的时候，就越接近正态分布）。而这个定理 amazing 的地方在于，无论是什么分布的随机变量，都满足这个定理。
- MLE(最大似然)
- OLS(最小二乘)
- 样本和抽样
- 置信区间
- 方差分析
- 回归分析
- bootstrap方法
- 马尔可夫链
线性代数
数值计算
- sigmoid函数
  sigmoid函数只能分两类
- Softmax激活函数
  softmax能分多类
- logistic函数
- Relu激活函数
- 网络参数
- 梯度下降Gradient Descent
- 学习率Learning Rate
  Subtopic
- 误差|损失
  均方误差(Mean Squared Error)
  交叉熵(Cross-Entropy)
- 损失函数(cost function)
  0-1损失函数
  当模型输出值=样本值，则为1，否则为0
  平方损失函数
  （模型输出值 - 样本值）^2
  绝对值损失函数
  |模型输出值 - 样本值|
  对数损失函数
  log (Y_模型输出)

原文地址：https://www.cnblogs.com/bigcome/p/10206911.html

时间： 2024-10-09 16:59:53

深度学习的数学基础的相关文章

深度学习数学基础

机器学习简介: 特征向量目标函数机器学习分类: 有监督学习:分类问题(如人脸识别.字符识别.语音识别).回归问题无监督学习:聚类问题.数据降维强化学习:根据当前状态预测下一个状态,回报最大化,回报具有延迟性,如无人驾驶.下围棋深度学习数学知识:微积分.线性代数.概率论.最优化方法一元函数微积分: 一元函数的泰勒展开:多项式近似代替函数一定是在某一点附近做泰勒展开的一元微分学:导数.泰勒展开.极值叛变法则. 多元函数微积分: 偏导数:其他变量当做常量,对其中一个变量求导数. 高阶偏

TensorFlow【机器学习】：如何正确的掌握Google深度学习框架TensorFlow（第二代分布式机器学习系统）？

本文标签: 机器学习 TensorFlow Google深度学习框架分布式机器学习唐源 VGG REST 服务器自 2015 年底开源到如今更快.更灵活.更方便的 1.0 版本正式发布,由 Google 推出的第二代分布式机器学习系统 TensorFlow一直在为我们带来惊喜,一方面是技术层面持续的迭代演进,从分布式版本.服务框架 TensorFlow Serving.上层封装 TF.Learn 到 Windows 支持.JIT 编译器 XLA.动态计算图框架 Fold 等,以及

关于机器学习和深度学习的资料

声明:转来的,原文出处:http://blog.csdn.net/achaoluo007/article/details/43564321 编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost 到随机森林.Deep Learning. &

机器学习和深度学习学习资料

比较全面的收集了机器学习的介绍文章,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <机器学习经典论文/survey合集>介绍:看题目你已经知道了是什么内容,没错.里面有很多经典的机器学习论文值得仔细与反复的阅读. <Brief History of Machine Learning>25介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <

[转]深度学习之浅见

通常来说,大家认为深度学习的观点是Geoffrey Hinton在2006年提出的.这一算法提出之后,得到了迅速的发展.关于深度学习,zouxy09的专栏中有详细的介绍,Free Mind 的博文也很值得一读.本博文是我对深度学习的一点看法,主要内容在第4.5部分,不当之处还请指教. 1.深度学习深度学习,即Deep Learning,是一种学习算法(Learning algorithm).学习算法这个很好理解,那么Deep指的是什么呢?这里的Deep是针对算法的结构而言的. 譬如,SVMs及

Python深度学习该怎么学？

Python想必对我们来说已经很熟悉了,Python的发展带来了一股学习Python的浪潮,聪明的人早已看准这个发展的好时机开始学习Python,那么我想问你知道Python深度学习是什么吗?不懂了吧,那让小编给你普及一下这方面的知识吧. 深度学习目前已经成为了人工智能领域的突出话题.它在"计算机视觉"和游戏(AlphaGo)等领域的突出表现而闻名,甚至超越了人类的能力.近几年对深度学习的关注度也在不断上升. 在这篇文章中,我们的目标是为所有Python深度学习的人提供一条学习之路,同

深度学习word2vec笔记之应用篇

好不容易学了一个深度学习的算法,大家是否比较爽了?但是回头想想,学这个是为了什么?吹牛皮吗?写论文吗?参加竞赛拿奖吗? 不管哪个原因,都显得有点校园思维了. 站在企业的层面,这样的方式显然是不符合要求的,如果只是学会了,公式推通了,但是没有在工作中应用上,那会被老大认为这是没有产出的.没有产出就相当于没有干活,没有干活的话就……呃……不说了. 下面就给大家弄些例子,说说在互联网广告这一块的应用吧. 一．对广告主的辅助 1.1基本概念互联网广告的广告主其实往往有他们的困惑,他们不知道自己的目标人

深度学习中得数学，高效计算基础与线性分类器

深度学习说到底就是要调节网络中得权重,使网络的分类结果更接近于训练值.这个重复迭代的过程又是一个线性回归的问题.在这种可能会用到高数,线性代数,概率论中的知识. 一.数学基础提一提. 1.高数中得知识. 高数中最重要的就是微积分了,那在深度学习中出现最多的一个概念就是梯度.什么是梯度呢?要说导数,学过高数的肯定都知道.其实梯度就是当把标量x变成向量X时,对X求导就是梯度.那为什么要用梯度呢?因为梯度等于0在凸函数中往往代表着一个极小值点.我们要求得就是损失函数的极小值,这正是我们需要的.梯度是指

深度学习算法实践7---前向神经网络算法原理

总体上来讲,神经网络的算法是比较复杂的,后面有非常精妙的数学原理,而且对这些数学方法,还需要证明其具有收敛性,所以很多神经网络的书籍,绝大部分都是一些数学模型介绍.推导和证明,对于非数学专业的我们来说,感沉像看天书一样.其实神经网络的精髓是将现实中的问题进行抽象,建立适合神经网络表示的模型,然后应用神经网络进行处理,不断调整优化网络结构和参数,直到最终达到满意的效果.所以成功应用神经网络,不需要太过高深的数学基础.但是如果可以适当掌握神经网络背后的数学原理,对于我们理解参数的含义,选择合适的网络