[转] 最大似然估计

原文链接：http://blog.sina.com.cn/s/blog_78fd98af0100xk7k.html

通俗的说说最大似然估计吧，文绉绉的概念和严谨的公式推导总是记不住，又让人昏昏欲睡....

1.什么是最大似然估计

如果我们知道样本（数据）所服从的概率分布的模型，而不知道该模型中的参数，例如：高斯模型的参数：均值u，及方差sigma。最大似然估计就是用来估计模型参数的统计学方法。

2.如何估计

我们有什么可以利用的信息呢？样本，概率分布模型。根据什么道理来估计呢？我们从总体中能够获得这些样本，为什么能获得，应该是获得这样的样本组合的概率最大。这样就将参数估计问题转化到最优化问题了。求最值，最简单的方法就是求导数，令导数为零，解方程。

设样本：，概率分布模型：f，要估计的参数θ，优化目标函数：

3.求解

首先假设样本独立同分布，则问题转化为：

在实际应用中常用的是两边取对数，得到公式如下：

其中称为对数似然，而称为平均对数似然。而我们平时所称的最大似然为最大的对数平均似然，即：

4.注意

（1）样本要满足的独立同分布

（2）参数 θ为参数向量，不一定就是一个数。

（3）求解上面的优化问题的方法可以用导数的方法，但有时可能解不唯一；有时可能行不通。所以也可以用其他优化方法。

时间： 2024-10-10 07:06:02

[转] 最大似然估计的相关文章

最小二乘法和最大似然估计

一:背景:当给出我们一些样本点,我们可以用一条直接对其进行拟合,如y= a0+a1x1+a2x2,公式中y是样本的标签,{x1,x2,x3}是特征,当我们给定特征的大小,让你预测标签,此时我们就需要事先知道参数{a1,a2}.而最小二乘法和最大似然估计就是根据一些给定样本(包括标签值)去对参数进行估计<参数估计的方法>.一般用于线性回归中获得参数进行拟合.而梯度下降方法主要用于逻辑回归分类问题中寻找最佳参数. 二:最小二乘法: 基本思想: 简单地说,最小二乘的思想就是要使得观测点和估计点的距离

极大似然估计

极大似然估计又称最大似然估计,对于一个已知的模型来说,还有些参数是不确定的,但是有了真实数据,那么这些参数可不可计算出呢?或者估计出最有可能的情况? 举个例子,例如有一组来自正态分布(也叫高斯分布)的样本数据,每个样本的数据都独立同分布,比如是正态分布,但正态分布的参数μ,σ都不知道,如果用极大似然估计的方法就可以用这些样本数据就可估计出正态分布中参数.概括起来说,就是用样本来估计总体情况,(调查问卷.人口普查等等其实就暗含这个原理). 假设总体X的分布为f(x:θ1,...θn),其中θ是未知

【MLE】最大似然估计Maximum Likelihood Estimation

模型已定,参数未知最大似然估计提供了一种给定观察数据来评估模型参数的方法,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差未知.我们没有人力与物力去统计全国每个人的身高,但是可以通过采样,获取部分人的身高,然后通过最大似然估计来获取上述假设中的正态分布的均值与方差. 最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立同分布的.下面我们具体描述一下最大似然估计: 首先,假设为独立同分布的采样,θ为模型参数,f为我们所使用的模型,遵循我们上述的独

【机器学习】（3）拟合度与最大似然估计

在大致了解了机器学习的算法分类(监督式.非监督式以及增强学习)和梯度算法后,今天我们来了解下拟合度和最大似然估计的相关问题. 一.最小二乘法的拟合度监督式学习中一类典型的应用就是回归问题,基本的就是线性回归,即用一条直线去逼近训练集合.最小二乘法就是根据已有的训练集样本来确定拟合度最好的函数曲线.但是由于选择一个什么样的曲线是人工决定的,而不同的曲线又具有不同的性质,从而导致不同函数模型使用最小二乘法的拟合度是不同的.以一个m个样本的房屋价格和大小数据M为例,我们可以选择线性回归(用一条直

转通俗理解最小二乘和最大似然估计

最大似然估计:现在已经拿到了很多个样本(你的数据集中所有因变量),这些样本值已经实现,最大似然估计就是去找到那个(组)参数估计值,使得前面已经实现的样本值发生概率最大.因为你手头上的样本已经实现了,其发生概率最大才符合逻辑.这时是求样本所有观测的联合概率最大化,是个连乘积,只要取对数,就变成了线性加总.此时通过对参数求导数,并令一阶导数为零,就可以通过解方程(组),得到最大似然估计值. 就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值! 换句话说,极大似然估

又看了一次EM 算法，还有高斯混合模型，最大似然估计

先列明材料: 高斯混合模型的推导计算(英文版): http://www.seanborman.com/publications/EM_algorithm.pdf 这位翻译写成中文版: http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html 高斯混合模型的流程: http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html 最大似然估计: http://bl

先验概率、后验概率、似然估计，似然函数、贝叶斯公式

联合概率的乘法公式: (如果随机变量是独立的,则) 由乘法公式可得条件概率公式:, , 全概率公式:,其中 (,则,则可轻易推导出上式) 贝叶斯公式: 又名后验概率公式.逆概率公式:后验概率＝似然函数×先验概率/证据因子.解释如下,假设我们根据“手臂是否很长”这个随机变量(取值为“手臂很长”或“手臂不长”)的观测样本数据来分析远处一个生物是猩猩类别还是人类类别(假设总共只有这2种类别).我们身处一个人迹罕至的深山老林里,且之前就有很多报道说这里有猩猩出没,所以无需观测样本数据就知道是猩猩的先验

统计参数的最大似然估计

已经介绍了统计参数的举估计,下面介绍另外一种估计,并且比较这两者. 对于一组样本,它们无条件是独立的.那么考虑到联合分布函数与边缘分布函数的关系,利用乘法原理,我们发现,样本的联合分布函数是: (离散) (连续) 又发现,它们是与总体同分布的:,那么连续的情况还可以写作: 现如今上面的式子中存在未知的参数,.把 L 换做以众多未知参数为元,就得到了: 称作是样本的似然函数. 当使得似然函数最大时的样本的参数估计,叫做样本的最大似然估计. 至于如何求之,仅仅是简单的多元函数求值而已. 发现 L 是

『科学计算_理论』最大似然估计

概述通俗来讲,最大似然估计,就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值. 重要的假设是所有采样满足独立同分布. 求解模型参数过程假如我们有一组连续变量的采样值(x1,x2,-,xn),我们知道这组数据服从正态分布,标准差已知.请问这个正态分布的期望值为多少时,产生这个已有数据的概率最大? P(Data | M) = ? 根据公式可得: 对μ求导可得 ,则最大似然估计的结果为μ=(x1+x2+-+xn)/n 由上可知最大似然估计的一般求解过程: (1) 写出似然函数

机器学习2-极大似然估计与贝叶斯估计

参数估计:最大似然.贝叶斯与最大后验为什么会有参数估计呢?这要源于我们对所研究问题的简化和假设.我们在看待一个问题的时候,经常会使用一些我们所熟知的经典的模型去简化问题,就像我们看一个房子,我们想到是不是可以把它看成是方形一样.如果我们已经知道这个房子是三间平房,那么大体上我们就可以用长方体去描述它的轮廓.这个画房子的问题就从无数的可能性中,基于方圆多少里大家都住平房的经验,我们可以假设它是长方体,剩下的问题就是确定长宽高这三个参数了,问题被简化了.再如学生考试的成绩,根据既往的经验,我们可以