第一篇,就写今天看的东西

一被别人问:你是学什么方向的
我默默回答一句:数据挖掘
别人意味深长の回答一句:哦.......
想必看出了我只是个小白。
既然清楚自己是个小白,开这个博客也只是为了让自己更好的做笔记,并且渴望得到大神的指点,让自己进步更快一些。
So,begin:
数据挖掘嘛,so,统计与概率,矩阵,机器学习,巴拉巴拉巴拉.....
一堆堆看不懂的东西,从接触数据挖掘之后,公式巨多,巨长,巨大,最亲切的也就是贝叶斯公式。
那就先从最简单的开始,概率
首先需要把名词解释清楚:先验概率、后验概率
先验概率是指根据以往经验和分析得到的概率,如全概率公式中的,它往往作为“由因求果”问题中的“因”出现。
后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的“因” 。
就我自己的理解,先验概率是可以通过已知信息算出来的,而后验概率是通过先验概率修正得出的。而修正先验概率利用的就是贝叶斯公式。
在此都是浅显地留个印象,接下来,咱们搞点数学。
先验概率(Prior probability)
在贝叶斯统计中,先验概率分布,即关于某个变量 p 的概率分布,是在获得某些信息或者依据前,对 p 的不确定性进行猜测。例如, p 可以是抢火车票开始时,抢到某一车次的概率。这是对不确定性(而不是随机性)赋予一个量化的数值的表征,这个量化数值可以是一个参数,或者是一个潜在的变量。

先验概率仅仅依赖于主观上的经验估计,也就是事先根据已有的知识的推断。在应用贝叶斯理论时,通常将先验概率乘以似然函数(likelihoodfunction)再归一化后,得到后验概率分布,后验概率分布即在已知给定的数据后,对不确定性的条件分布。
似然函数(likelihood function)
称作似然,是一个关于统计模型参数的函数。也就是这个函数中自变量是统计模型的参数。对于结果 x ,在参数集合 θ 上的似然,就是在给定这些参数值的基础上,观察到的结果的概率 L(θ|x)=P(x|θ) 。也就是说,似然是关于参数的函数,在参数给定的条件下,对于观察到的 x 的值的条件分布。
后验概率(Posterior probability)
后验概率是关于随机事件或者不确定性断言的条件概率,是在相关证据或者背景给定并纳入考虑之后的条件概率。后验概率分布就是未知量作为随机变量的概率分布,并且是在基于实验或者调查所获得的信息上的条件分布。“后验”在这里意思是,考虑相关事件已经被检视并且能够得到一些信息。
后验概率是关于参数 θ 在给定的证据信息 X 下的概率: p(θ|x) 。若对比后验概率和似然函数,似然函数是在给定参数下的证据信息 X 的概率分布: p(x|θ) 。
二者有如下关系:
我们用 p(θ) 表示概率分布函数(相当于先验概率),用 p(x|θ) 表示观测值 x 的似然函数。后验概率定义如下:
p(θ|x)=p(x|θ)p(θ)/p(x)
在分母不变的情况下,就成了:Posteriorprobability∝Likelihood×Prior probability
接下来用个例子说明问题
一口袋里有3只红球、2只白球,采用不放回方式摸取,求:⑴ 第一次摸到红球(记作A)的概率;⑵ 第二次摸到红球(记作B)的概率;⑶ 已知第二次摸到了红球,求第一次摸到的是红球的概率。
(1)对于这一问,就相当于在计算一个先验概率的问题,P(A) = 3/5
(2)在考虑这个问题时:P(B) = P(AB)+P(A逆B) = P(B/A)P(A)+P(B/A逆)P(A逆) = 2/4 *3/5+3/4*2/5 = 3/5
(3)对于这个问题,也就是求P(A/B) ,这是一个典型的后验概率,P(A/B) = P(AB)/P(B) = P(B/A)*P(A)/P(B) = (2/4*3/5)/(3/5) = 1/2
时间: 2024-08-06 11:31:14

第一篇,就写今天看的东西的相关文章

Java小白入门系列 第一篇 写在前面

2018年8月30日  22:00:17 郑州  多云 Sue Java小白入门系列 第一篇  写在前面 写在前面: 首先声明一下,本人也是正在学Java,并不是多么专业人士,只是最近受老师的启发,所以准备写个关于java新手入门系列的博客,包括搭建Java开发环境.Java入门知识,也会分享一些好用的软件及破解器之类的,一方面是巩固所学的知识,另一方面是给有兴趣的小白做练手.入门之用,本系列博客完全开放,所有资源不收任何费用,欢迎大家转发留言,入门之用,不喜勿喷,恶人绕道! Java是不是很难

Swing:LookAndFeel 教程第一篇——手把手教你写出自己的 LookAndFeel

本文是 LookAndFeel 系列教程的第一篇. 是我在对 Swing 学习摸索中的一些微薄经验. 我相信,细致看全然系列之后.你就能写出自己的 LookAndFeel. 你会发现 Swing 原来能够这样美. -------------------------------------------------------------------------------- 引言: 我第一次接触 Java 要追溯到非常多年前做毕业设计的时候. 那天我和同学来到了一个微型软件公司(三程序猿.一会计.

耶!!!第一篇 HTML 最最最最基础之前学习的东西

今天在飘飘同学的鼓励和建议下,我终于开通了博客园博客哈哈!!!决定把新学习的一些东西的笔记记录在这里,还可以互相监督学习,互相鼓励!谁让我们都是追求进步的人呢是吧!哦吼吼吼 之前自己一直跟着视频学习了一些html,其实学习的很慢很慢(按理说如果不是跟着视频,而是就看看html代码可能学得更快,不过也可能基础不牢固.不过说实话html这东西估计也没什么基础牢不牢固而言额).刚才突发奇想去w3schools上面做了一个20道题的小test,本来以为结果会很惨没想到还行.在这分享一下答案 - W3Sc

Android基础学习第一篇—Project目录结构

写在前面的话: 1. 最近在自学Android,也是边看书边写一些Demo,由于知识点越来越多,脑子越来越记不清楚,所以打算写成读书笔记,供以后查看,也算是把自己学到所理解的东西写出来,献丑,如有不对的地方,希望大家给与指正. 2. 由于类似于读书笔记,可能格式神马的会比较随(hen)意(chou),大家看着受不了,可以使劲吐槽. *************************************我只是分割线***************************************

第二十二篇:再写Windows驱动,再玩Windbg---NET

2011年到现在,就没再怎么搞过Windows驱动了. 最近, 由于项目需要, 试着改一改一个显卡驱动(KMDOD), 从实践上证明, 我在理论上对一个驱动的架构的正确与否.(USB Display = KMDOD + AVStream). 其中, KMDOD是完成显示的部分功能, 完成其中的VidPN(Video present network), 将驱动中原来的POST物理设备转变为USB物理设备. 而AVStream之所以这样提出, 完成是由于USB Video class的启发, 要不然

cocos2d-x 3.2 之 2048 —— 第一篇

***************************************转载请注明出处:http://blog.csdn.net/lttree****************************************** 2048这款游戏,已经有一段时间了,之前一直想做一款. 可是.cocos2d-x 引擎 正在学习,并有别的事情忙.一直延到如今. 好吧.最终要做一下了~. ~ 这是第一篇,主要会说明一下: --屏幕适配 --主界面 布局及设计 在前言 中.已经展示过我做的2048,

零基础学cocos2dx 3.0(顺带学C++)第一篇 切换场景

不会去重复一些概念性的东西,具体的内容,我在代码中已经备注出来.先看目录,这个创建完项目目录的Classes文件夹下有4个文件,我把helloworld那两个文件直接改了名字,这里我叫MainScene .切记,在改为名字之后需要到appDelegate.pp里面把对应的helloworld改过来. 废话不多说,直接上代码 1,appDelegate.h #ifndef _APP_DELEGATE_H_ #define _APP_DELEGATE_H_ #include "cocos2d.h&q

C#4.0语法糖之第一篇:自动属性&隐式类型

今天给大家分享一下C#语法糖的简单的两个知识点吧. 自动属性:在 C# 4.0 和更高版本中,当属性的访问器中不需要其他逻辑时,自动实现的属性可使属性声明更加简洁. 客户端代码还可通过这些属性创建对象. get and set accessors." id="mt3">如下面的示例所示声明属性时,编译器将创建一个私有的匿名支持字段,该字段只能通过属性的 get 和 set 访问器进行访问. 我们C#4.0以前的传统方式的属性是用来封装字段的,这里我简单的对比一下这两种方

解剖SQLSERVER 第一篇 数据库恢复软件商的黑幕

解剖SQLSERVER 第一篇  数据库恢复软件商的黑幕 这一系列,我们一起来解剖SQLSERVER 在系列的第一篇文章里本人可能会得罪某些人,但是作为一位SQLSERVER MVP,在我的MVP任期内希望可以对大家作出一些贡献 在第一篇里面涉及到某些内容可能不会以详细的方式给出截图并且和大家讲解,毕竟第一篇的篇幅比较长,希望大家见谅.. 在第一篇文章开始之前,先说三个题外话 第一个题外话  更新丢失 首先要做的事情是,跟大家道歉 在之前<SQLSERVER走起>的微信公众帐号里推送了一篇文章