贝叶斯原理

1. 前言

贝叶斯学派很古老,但是从诞生到一百年前一直不是主流。主流是频率学派。频率学派的权威皮尔逊和费歇尔都对贝叶斯学派不屑一顾,但是贝叶斯学派硬是凭借在现代特定领域的出色应用表现为自己赢得了半壁江山。

贝叶斯学派的思想可以概括为先验概率+数据=后验概率。也就是说我们在实际问题中需要得到的后验概率,可以通过先验概率和数据一起综合得到。数据大家好理解,被频率学派攻击的是先验概率,一般来说先验概率就是我们对于数据所在领域的历史经验,但是这个经验常常难以量化或者模型化,于是贝叶斯学派大胆的假设先验分布的模型,比如正态分布,beta分布等。这个假设一般没有特定的依据,因此一直被频率学派认为很荒谬。虽然难以从严密的数学逻辑里推出贝叶斯学派的逻辑,但是在很多实际应用中,贝叶斯理论很好用,比如垃圾邮件分类,文本分类

2. 概率论基础

首先介绍的是多个随机变量之间的关系,主要涉及联合概率,边缘概率,条件概率这三种关系。相应的概率都可以计算相应的信息熵的值

2.1 联合概率

联合概率指的是包含多个条件且所有条件同时成立的概率,记作\(P(X=a,Y=b)\)。

2.2 边缘分布

边缘概率是与联合概率对应的,\(P(X=a)\)或\(P(Y=b)\),这类仅与单个随机变量有关的概率称为边缘概率

2.3 条件分布

条件概率表示在条件\(Y=b\)成立的情况下,\(X=a\)的概率,记作\(P(X=a|Y=b)\).它具有如下性质:

“在条件\(Y=b\)下\(X\)的条件分布”也是一种“\(X\)的概率分布”,因此穷举\(X\)的可取值之后,所有这些值对应的概率之和为1即 \(\sum_aP(X=a|Y=b)=1\)

2.4 联合概率与边缘概率的关系

\[
P(X=a)=\sum_bP(X=a,Y=b)
\]

2.5 联合概率、边缘概率与条件概率之间的关系

\[
P(X=a|Y=b)=\frac{P(X=a,Y=b)}{P(Y=b)}
\]

3. 贝叶斯定理

贝叶斯定理的基础是先验概率+数据=后验概率。贝叶斯定理解决的是一些原因X无法直接观测、测量,而我们希望通过其结果Y来反推出原因X的问题,也就是知道一部分先验概率,来求后验概率的问题。

3.1 条件独立公式

如果X和Y相互独立,则有:

\[
P(X,Y)=P(X)P(Y)
\]

3.2 条件概率公式

\[
P(Y|X)=\frac{P(X,Y)}{P(X)}
\]

\[
P(X|Y)=\frac{P(X,Y)}{P(Y)}
\]

3.3 全概率公式

\[
P(X)=\sum_kP(X|Y=Y_k)P(Y_k)
\]

3.4 贝叶斯公式

\[
P(Y|X)=\frac{P(X|Y)P(Y)}{P(X)}=\frac{P(X|Y)P(Y)}{\sum_kP(X|Y=Y_k)P(Y_k)}
\]

原文地址:https://www.cnblogs.com/huangyc/p/9734960.html

时间: 2024-08-08 14:17:49

贝叶斯原理的相关文章

机器学习-朴素贝叶斯原理及Python实现

机器学习-朴素贝叶斯原理及Python实现 贝叶斯公式 P(A|B) = (P(B|A)P(A))/P(B) 举例:苹果10个,有2个黄色:梨10个,有6个黄色,求拿出一个黄色水果,是苹果的概率. 代入公式: P(苹果|黄色) = (P(黄色|苹果)P(苹果))/P(黄色) P(黄色) = (2+6)/20 = 2/5 P(苹果) = 10/20 = 1/2 = 0.5 P(黄色|苹果)=1/5 P(黄色|苹果)P(苹果) = P(黄色,苹果) = 1/5*1/2 = 1/10 = 0.1 P(

概率--学习朴素贝叶斯分布

概率是一种基于事件发生可能性来描述未来趋势的数学工具.其本质就是通过过去已经发生的事情来推断未来事件,并且将这种推断放在一系列的公理化的数学空间当中进行考虑.例如,抛一枚均质硬币,正面向上的可能性多大?概率值是一个0-1之间的数字,用来衡量一个事件发生可能性的大小.概率值越接近于1,事件发生的可能性越大,概率值越接近于0,事件越不可能发生.天气预报员通常会使用像"明天80%的可能性会下雨"这样的术语来对降雨进行预测,这里70%或者0.7就是下雨的概率.在现实生活中,要么下雨,要么不下雨

斯坦福机器学习实现与分析之六(朴素贝叶斯)

朴素贝叶斯(Naive Bayes)适用于离散特征的分类问题,对于连续问题则需将特征离散化后使用.朴素贝叶斯有多元伯努利事件模型和多项式事件模型,在伯努利事件模型中,特征每一维的值只能是0或1,而多项式模型中特征每一维的值可取0到N之间的整数,因此伯努利模型是多项式模型的一种特例,下面的推导就直接使用伯努利模型. 朴素贝叶斯原理推导 与GDA类似,朴素贝叶斯对一个测试样本分类时,通过比较p(y=0|x)和p(y=1|x)来进行决策.根据贝叶斯公式: \( \begin{aligned} p(y=

贝叶斯推断及其互联网应用(二):过滤垃圾邮件

有关贝叶斯原理的讲解, 请查看这里.这里讲述的是通过贝叶斯推断如何过滤垃圾邮件. 贝叶斯推断及其互联网应用        (接上文) 七.什么是贝叶斯过滤器?    垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户.    正确识别垃圾邮件的技术难度非常大.传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等.前者的过滤依据是特定的词语:后者则是计算邮件文本的效验码,再与已知的垃圾邮件进行对比.它们的识别效果都不理想,而且很容易规避.    2002年,P

【Spark MLlib速成宝典】模型篇04朴素贝叶斯【Naive Bayes】(Python版)

目录 朴素贝叶斯原理 朴素贝叶斯代码(Spark Python) 朴素贝叶斯原理 详见博文:http://www.cnblogs.com/itmorn/p/7905975.html 返回目录 朴素贝叶斯代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1jHWKG4I 密码:acq1 # -*-coding=utf-8 -*- from pyspark import SparkConf, SparkContext sc = SparkContext('

深入理解朴素贝叶斯(Naive Bayes)

https://blog.csdn.net/li8zi8fa/article/details/76176597 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法.朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤.该算法虽然简单,但是由于笔者不常用,总是看过即忘,这是写这篇博文的初衷.当然,更大的动力来在于跟大家交流,有论述不妥的地方欢迎指正. 1.算法思想--基于概率的预测 逻辑回归通过拟合曲线(或者学习超平面)实现分类,决策树通过寻找最佳划分特征进而学习

04-朴素贝叶斯

朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类.本章首先介绍贝叶斯分类算法的基础——贝叶斯定理.最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类. 贝叶斯理论 & 条件概率 贝叶斯理论 我们现在有一个数据集,它由两类数据组成,数据分布如下图所示: 我们现在用 p1(x,y) 表示数据点 (x,y) 属于类别 1(图中用圆点表示的类别)的概率,用 p2(x,y) 表示数据点 (x,y) 属于类别 2(图中三角形表示的类别)的概

朴素贝叶斯-垃圾邮件分类实现

1. 前言 <朴素贝叶斯算法(Naive Bayes)>,介绍了朴素贝叶斯原理.本文介绍的是朴素贝叶斯的基础实现,用来垃圾邮件分类. 2. 朴素贝叶斯基础实现 朴素贝叶斯 (naive Bayes) 法是基于贝叶斯定理与特征条件独立假设的分类的方法.对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布:然后基于此模型,对于给定的输入$x$,利用贝叶斯定理求出后验概率最大的输出$y$,完整代码GitHub. 输入: #垃圾邮件的内容 posting_list = [ ['m

贝叶斯和朴素贝叶斯是啥

目录 一.贝叶斯 先验概率.似然概率.后验概率 公式推导 二.为什么需要朴素贝叶斯 三.朴素贝叶斯是什么 条件独立 举例:长肌肉 拉普拉斯平滑 半朴素贝叶斯 一.贝叶斯 简单地说,贝叶斯就是你见到贝克汉姆,说了一句yes,研究的是这种概率事件. 开玩笑啦,贝叶斯原理是英国数学家托马斯·贝叶斯提出的,为了解决一个"逆概率"问题. 例如,如果一个男人发现了他老婆手机里暧昧短信 ,计算机他老婆出轨的概率. 现实生活中,我们很难知道事情的全貌,当不能准确预知一个事物本质的时候,但是可以依靠和事