贝叶斯之起因(概率论分析)

条件概率:P(X|Y)

联合概率:P(X, Y)

边缘概率:P(X), P(Y).

联合概率 = 条件概率 * 边缘概率

通常会用条件概率来解决逆问题。

  • 逆问题是指:需要从结果反推原因的问题;
  • 正问题是指:从原因推出结果。
    • 逆问题常见的有:

      • 通信:根据含有噪声的接收信号Y推测发送信号X;
      • 语音识别:根据苗科峰识别的音频波形数据Y推测语音信息X;
      • 文字识别:根据扫描仪读取的图像Y推测用户书写的文字X;
      • 邮件自动过滤:根据收到的邮件文本Y推测邮件的类型X(是否是广告等)
    • 通过随机变量X,Y来表述X,Y之间的关系。
  • 贝叶斯公式讨论以下这种类型的问题:

    • 一致所有的P(原因)和P(结果|原因)
    • 求P(原因|结果)

其中,P(原因)称为先验概率,P(原因|结果)称为后验概率,响应的分布称为先验分布和后验分布。

  • 独立性:

    • 如果问题中存在多个随机变量,我们首先会考察这些随机变量之间是否真的存在关联::

      • 如果X与Y无关,则由X推Y就没有意义。
      • “独立”与“均匀分布”不同:P(Y=1|X=**) = P(Y=2|X=**) = P(Y=3|X=**)=....(并不满足独立性)
      • “独立”与“独立同分布”不同:P(X=1) = P(Y=1), P(X=2) = P(Y=2), P(X=3) = P(Y=3), ...
      • "独立"与“互斥”不同:独立性并不意味这“事件X=1与Y=1不会同时发生”,互斥反而表示X与Y之间不是独立的随机变量。
      • 独立性是指X与Y没有任何关联,我们无法根据Y来判断X的值
    • 满足的性质:

      • 条件概率与条件无关:P(X|Y) = P(X|-Y)
      • 添加或去除条件不影响:P(X|Y) = P(X)
      • 联合概率是边缘概率的乘积:P(X, Y) = P(X)*P(Y)
时间: 2024-10-25 12:23:28

贝叶斯之起因(概率论分析)的相关文章

基于MapReduce的朴素贝叶斯算法的实现与分析

一.朴素贝叶斯(Na?ve Bayes)分类器 1.1 公式 朴素贝叶斯是一个概率分类器 文档 d 属于类别 c 的概率计算如下(多项式模型): nd是文档的长度(词条的个数) P(tk |c) 是词项tk 出现在类别c中文档的概率,即类别c文档的一元语言模型 P(tk |c) 度量的是当c是正确类别时tk 的贡献 P(c) 是类别c的先验概率 如果文档的词项无法提供属于哪个类别的信息,那么我们直接选择P(c)最高的那个类别 1.2 具有最大后验概率的类别 §朴素贝叶斯分类的目标是寻找"最佳&q

C#编程实现朴素贝叶斯算法下的情感分析

C#编程实现 这篇文章做了什么 朴素贝叶斯算法是机器学习中非常重要的分类算法,用途十分广泛,如垃圾邮件处理等.而情感分析(Sentiment Analysis)是自然语言处理(Natural Language Progressing)中的重要问题,用以对文本进行正负面的判断,以及情感度评分和意见挖掘.本文借助朴素贝叶斯算法,针对文本正负面进行判别,并且利用C#进行编程实现. 不先介绍点基础? 朴素贝叶斯,真的很朴素 朴素贝叶斯分类算法,是一种有监督学习算法,通过对训练集的学习,基于先验概率与贝叶

实现 | 朴素贝叶斯模型算法研究与实例分析

实现 | 朴素贝叶斯模型算法研究与实例分析(白宁超2018年9月4日09:03:21) 导读:朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果.所以很受欢迎,对于朴素贝叶斯的学习,本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导,为了加深理解,采用一个维基百科上面性别分类例子进行形式化描述.然后通过编程实现朴素贝叶斯分类算法,并在屏蔽社区言论.垃圾邮件.个人广告中获取区域倾向等几个方面进行应用,包括创建数据集.数据预处理.词集模型和词袋模型.朴素贝叶斯

机器学习实战笔记(Python实现)-03-朴素贝叶斯

--------------------------------------------------------------------------------------- 本系列文章为<机器学习实战>学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正. 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction -----------------------------------------------

贝叶斯网络 学习笔记

一.概述 贝叶斯网是概率论和图论相结合的产物,可以从概率论的角度讨论变量间的依赖与独立,也可以从图论的角度讨论节点间的连通与分隔,两者有深刻的联系. 1.通过图论准则可以判别变量间条件独立关系. 2.X 与 Y 不直接相连,通过其他变量才能在两者间传递信息;如果 X 和 Y 之间的所有信息通道都被阻塞,那么信息就无法再它们之间传递. 二.贝叶斯网络推理 (Inference) 贝叶斯网络可以利用变量间的条件独立对联合分布进行分解,降低参数个数,推理 (inference) 是通过计算来回答查询的

Python----朴素贝叶斯

1.朴素贝叶斯 朴素贝叶斯是使用概率论来分类的算法.其中朴素:各特征条件独立:贝叶斯:根据贝叶斯定理. 根据贝叶斯定理,对一个分类问题,给定样本特征B,样本属于类别A的概率是: 2.算法特点 优点: 在数据较少的情况下仍然有效,可以处理多类别问题. 缺点: 对于输入数据的准备方式较为敏感. 适用数据类型: 标称型数据. 3.实例 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import

第四章:基于概率论的分类方法: 朴素贝叶斯

本章内容□使用概率分布进行分类□学习朴素贝叶斯分类器□解析RSS源数据口使用朴素贝叶斯来分析不同地区的态度 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案.不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值.       概率论是许多机器学习算法的基础,所以深刻理解这一主题就显得十分重要.第3章在计算特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值的次数,然后除以数据集的

机器学习实战读书笔记(四)基于概率论的分类方法:朴素贝叶斯

4.1 基于贝叶斯决策理论的分类方法 朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 贝叶斯决策理论的核心思想:选择具有最高概率的决策. 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类 朴素贝叶斯的一般过程: 1.收集数据 2.准备数据 3.分析数据 4.训练算法 5.测试算法 6.使用算法 朴素贝叶斯分类器中的另一个假设是,每个特征同等重要. 4.5 使用Python进行文本分类

详解基于朴素贝叶斯的情感分析及 Python 实现

相对于「 基于词典的分析 」,「 基于机器学习 」的就不需要大量标注的词典,但是需要大量标记的数据,比如: 还是下面这句话,如果它的标签是: 服务质量 - 中 (共有三个级别,好.中.差) ╮(╯-╰)╭,其是机器学习,通过大量已经标签的数据训练出一个模型, 然后你在输入一条评论,来判断标签级别 宁馨的点评 国庆活动,用62开头的信用卡可以6.2元买一个印有银联卡标记的冰淇淋, 有香草,巧克力和抹茶三种口味可选,我选的是香草口味,味道很浓郁. 另外任意消费都可以10元买两个马卡龙,个头虽不是很大