概率论杂记

摘要:

  1.本福特定律

  2.商品推荐的惊喜度

  3.贝叶斯学派和频率学派

  4.指数分布族

  5.期望

  6.方差

  7.协方差

  8.皮尔逊相关系数

1.本福特定律

github代码部分

2.商品推荐的惊喜度:

商品推荐场景中过于聚集的商品推荐往往会损害用户体验,在有些场景中,系统会通过一定程度的随机性给用户带来发现的惊喜度。假设A,B商品与当前用户的匹配度分别为0.8,0.2,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个0到0.2的得分,问终B的得分大于A的得分的概率?

3.贝叶斯学派和频率学派(参数空间,统计推断):

贝叶斯学派:假定参数本身是变化的,服从某个分布。求在这个分布约束下使得某目标函数极大/极小(贝叶斯模型)

频率学派:假定参数是某个/某些未知的定值,求这些参数如何取值,能够使得某目标函数取极大/极小(矩估计,似然估计,最大熵,期望最大化等)

扩展:知乎问答

4.指数分布族:

注:验证高斯分布属于指数分布族

5.期望(expectation)

概率加权下的平均值

阿里试题1:从1,2,3,...,98,99,1024这100个数中任意选择若干个数求异或,则异或的期望值是什么?

解:若干个数异或,只有当某位取奇数个1时第i位才为1,故此题只要考虑各个位数取1的概率即可

1024的二进制表示为100,0000,0000,明显这里第7,8,9位不为1,,而其余99个数也取不到这3位,则有

而对于其余位,有如下计算:

阿里试题2:

由二项分布的期望,有np=1,得S的元素个数是1024

6.方差:

7.协方差:

协方差矩阵式对称阵

8.相关系数

扩展:常见的距离算法和相似度(相关系数)计算方法

时间: 2024-09-26 20:09:58

概率论杂记的相关文章

【概率论与数理统计】小结2 - 随机变量概述

注:对随机变量及其取值规律的研究是概率论的核心内容.在上一个小结中,总结了随机变量的概念以及随机变量与事件的联系.这个小结会更加深入的讨论随机变量. 随机变量与事件 随机变量的本质是一种函数(映射关系),在古典概率模型中,“事件和事件的概率”是核心概念:但是在现代概率论中,“随机变量及其取值规律”是核心概念. 随机变量与事件的联系与区别 小结1中对这两个概念的联系进行了非常详细的描述.随机变量实际上只是事件的另一种表达方式,这种表达方式更加形式化和符号化,也更加便于理解以及进行逻辑运算.不同的事

【概率论与数理统计】小结1 - 基本概念

注:其实从中学就开始学习统计学了,最早的写"正"字唱票(相当于寻找众数),就是一种统计分析的过程.还有画直方图,求平均值,找中位数等.自己在学校里并没有完整系统的学习过概率论和数理统计,直到在工作中用到,才从最初的印象中,逐渐把这门学科与整个数学区分开来.自从认识到这门学科在自己从事的工作(数据分析)中所处的重要地位,真没少花时间在这方面的学习上.从最初的p值的含义,到各种分布,假设检验,方差分析...有的概念看过很多遍,但还是没有理解透彻:有的看过,长时间不用,又忘记了.总之,这一路

【转载】C/C++杂记:虚函数的实现的基本原理

原文:C/C++杂记:虚函数的实现的基本原理 1. 概述 简单地说,每一个含有虚函数(无论是其本身的,还是继承而来的)的类都至少有一个与之对应的虚函数表,其中存放着该类所有的虚函数对应的函数指针.例: 其中: B的虚函数表中存放着B::foo和B::bar两个函数指针. D的虚函数表中存放的既有继承自B的虚函数B::foo,又有重写(override)了基类虚函数B::bar的D::bar,还有新增的虚函数D::quz. 提示:为了描述方便,本文在探讨对象内存布局时,将忽略内存对齐对布局的影响.

C/C++杂记:虚函数的实现的基本原理

1. 概述 简单地说,每一个含有虚函数(无论是其本身的,还是继承而来的)的类都至少有一个与之对应的虚函数表,其中存放着该类所有的虚函数对应的函数指针.例: 其中: B的虚函数表中存放着B::foo和B::bar两个函数指针. D的虚函数表中存放的既有继承自B的虚函数B::foo,又有重写(override)了基类虚函数B::bar的D::bar,还有新增的虚函数D::quz. 提示:为了描述方便,本文在探讨对象内存布局时,将忽略内存对齐对布局的影响. 2. 虚函数表构造过程 从编译器的角度来说,

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论 七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

概率论与数理统计总结-Fall2014

概率论部分的总结 Chapter 1: 随机事件及其概率 1 随机试验:样本点:样本空间 2 随机事件:必然事件:不可能事件:互不相容事件:对立事件 3 概率的公理化定义 4 概率的性质:有限可加性,减法公式,加法公式,及推论 5 条件概率及乘法公式 6 两个事件相互独立的定义及性质:多个事件相互独立的定义及性质 7 伯努利概率模型 8 全概率公式 9 贝叶斯公式 Chapter 2: 随机变量及其分布 1 随机变量:离散型随机变量:连续型随机变量 2 分布函数及性质 3 离散型随机变量的分布率

CS281: Advanced Machine Learning 第二节 probability theory 概率论

概率论基本概念 离散变量 概率论中的两个基本法则:加法法则和乘法法则,加法法则定义了随机变量X与条件变量Y之间的直接联系.乘法法则定义了概率学中最重要的条件概率,同时也可以叫做联合概率,因为它描述了事件X和Y同时发生的概率. 通过上面公式可以推到出条件概率公式: 进而可以得到著名的贝叶斯公式,贝叶斯公式广泛的应用于科学界,这也被称为后验概率,因为它在咱们知道了p(Y=y)这个先验概率之后才能计算出来. 如果两个随机变量x,y满足以下公式,那么说明他们是互相独立的: 如果三个随机变量x,y,z满足

跟着vamei复习概率论

最近重新看了一下概率论,感觉很多东西都遗忘了,还会陷入各种误区,赶紧的纠正回来. 概率论这块,主要内容包括: 事件.条件概率.随机变量.随机变量的分布函数.概率密度.联合分布.期望.方差.协方差. 我自己的误区总结: 1.事件和随机变量 首先要明确样本空间是所有可能发生的事件的集合,它由全部基本事件组成.而事件是基本时间的集合,是样本空间的子集,事件是固定的,或者说事件的概率是固定的(贝叶斯学派加入的先验概率先不考虑).而随机变量一个映射,是从事件到实数的映射,随机变量表达了整个样本空间,描述了

概率论学习小结(road map)

在最近学习模式识别和机器学习时经常会用到概率论的知识,索性重新复习一遍概率论的知识.学习概率论最重要的一点不是公式的记忆,而是对公式背后的含义的理解.(其实学习任何一门知识都是如此,但是相比高数等的抽象性来说,概率可能显得更"接地气") 曾经在大学时代数学中学的最差的一门课便是概率论,然而最近的学习中,在几经挣扎之后却渐渐找到了这门课的乐趣,在本科时候学习的那个小小的课本将概率论的趣味完全遮盖住了. 学习概率论首先要明白这门课的意义.概率论顾名思义是研究事件发生的可能性的学科,这里不使