机器学习数学基础 - 概率论

随机事件和概率

基础概念

?  随机试验

?  样本点和样本空间

?  随机事件

随机事件的概率

?  例子

条件概率

?  定义

?  例子

事件的独立性

?  定义

?  例子

全概率公式和贝叶斯公式

全概率公式

贝叶斯公式

实例

随机变量, 期望和方差

随机变量

?  定义

?  例子

概率分布

?  定义

?  性质

概率密度函数

随机变量的期望

随机变量的方差

最大似然估计

原文地址:https://www.cnblogs.com/shijieli/p/11620323.html

时间: 2024-10-02 00:02:19

机器学习数学基础 - 概率论的相关文章

提升机器学习数学基础,这7本书一定要读-附pdf资源

文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | KDnuggets 作者 | Ajit Jaokar 转自 | 新智元 编辑 | 大明 [编者按]机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物.相信对打好数学基础的相关人士会有所帮助. 大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能.但是,要真正精通数据科学和机器学习,必

机器学习数学基础- gradient descent算法(上)

为什么要了解点数学基础 学习大数据分布式计算时多少会涉及到机器学习的算法,所以理解一些机器学习基础,有助于理解大数据分布式计算系统(例如spark)的设计.机器学习中一个常见的就是gradient descent算法,是线性回归问题的一个基础算法.gradient是数学概念. Gradient 假设一个函数有n个自变量:f(x1,x2......xn),且每个x都是标量值,那么该函数的gradient就是一个n维的向量函数,每个component是f函数针对xi的partial derivati

机器学习中概率论知识复习

机器学习先验知识概率论部分,发现看Machine Learning(-Andrew Ng)课程的时候中间有推导过程不是很明白,遂针对性复习. 知识内容组织结构,参考:<Probability Theory Review for Machine Learning>(Machine Learning-Andrew Ng,课程讲义复习笔记2) 内容补充,参考维基百科. 公式编辑参考:http://meta.math.stackexchange.com/questions/5020/mathjax-b

机器学习数学基础总结

目录 线性代数 一.基本知识 二.向量操作 三.矩阵运算 概率论与随机过程 一.概率与分布 1.1 条件概率与独立事件 1.2 联合概率分布 二.期望 三.方差 3.1 方差 3.2 协方差与相关系数 3.3 协方差矩阵 四.大数定律及中心极限定理 4.1 切比雪夫不等式 4.2 大数定理 4.3 中心极限定理 五.不确定性来源 六.常见概率分布 6.1 均匀分布 6.2 二项分布 6.3 高斯分布 6.4 指数分布 6.5 拉普拉斯分布 6.6 狄拉克分布 6.7 多项式分布与狄里克雷分布 6

机器学习数学基础

数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学简史,因为,只有了解各个定理.公式的发明历史,演进历程.相关联系,才能更好的理解你眼前所见到的知识,才能更好的运用之.

机器学习数学基础- gradient descent算法(下)

Gradient Descent算法 续上文. gradient descent的用途: 可以用于求解一个函数f(x1,x2,......xn)的local 最小值. 关于local最小值: 一个函数可能有多个local最小值,所谓local最小值是当给定(x1,x2,......xn)的某一个实例,如果在该实例的无限小的附近的任何一个实例的f值都大于该实例的f值,那么该实例所对应的就是f的一个local最小值. gradient descent算法求解local最小值的方法如下: 任意给定(x

机器学习数学基础知识备忘

1.特征值分解 2.奇异值分解 奇异值的物理意义是什么? 奇异值分解(SVD)原理详解及推导 奇异值分解(SVD)原理与在降维中的应用 奇异值分解 SVD 的数学解释 3. 原文地址:https://www.cnblogs.com/yhlx125/p/9488276.html

机器学习 基于概率论的分类方法:朴素贝叶斯

分类器可能产生错误分类,要求分类器给出一个最优的类别猜测结果并给出这个猜测的概率估计值. 朴素贝叶斯的特点: 优点:在数据较少的情况下依然有效,可以处理多类别问题: 缺点:对于输入数据的准备方式较为敏感: 适用数据类型:标称型数据 条件概率:在A条件下发生B结果的概率: P(B|A) = P(A&B)/P(A) 在A条件下发生B结果的概率等于A和B同时发生的概率除以A发生的概率 P(A&B) = P(A)*P(B|A) A和B同时发生的概率等于A发生的概率乘以A条件下B发生的概率 P(A&

【机器学习数学基础】线性代数基础

目录 线性代数 一.基本知识 二.向量操作 三.矩阵运算 线性代数 一.基本知识 本书中所有的向量都是列向量的形式: \[\mathbf{\vec x}=(x_1,x_2,\cdots,x_n)^T=\begin{bmatrix}x_1\\x_2\\ \vdots \\x_n\end{bmatrix}\] 本书中所有的矩 \(\mathbf X\in \mathbb R^{m\times n}\) 都表示为: \[\mathbf X = \begin{bmatrix} x_{1,1}&x_{1,