计算机视觉总结(一)——Mean shift

在彻底了解mean shift之前,我们需要解决三个问题:

第一个问题:无参数密度估计

无参数密度估计,它对数据分布规律没有附加任何假设,而是直接从数据样本本身出发研究数据分布特征,对先验知识要求少,完全依靠训练数据进行估计,而且能够处理任意的概率分布。

eg. 直方图法,最近邻域法,核密度估计法

而有参数密度估计有:高斯统计模型

举个例子:

有N个数据点,它们的坐标分布如下图所示,如何求出这个区域中,哪个位置的样本分布密度最大,换言之,如果来了第N+1个样本点,它最大的可能出现位置在哪里。

第二个问题:Kernel density estimation

给定维空间中的样本集合,则点关于核函数和带宽矩阵的核函数密度估计表示为:

其中

由于,可将密度估计写成关于核函数的轮廓函数形式:

由上面的公式可以看出,其实核函数密度估计最后可以看做成为一种权值函数,其作用是将每个样本点按与点x的距离远近进行加权,距离x点近的样本点概率密度估计影响大,赋予权值也越大;反之权值越小。

第三个问题:Mean shift 向量

从上轮可以得出对数据的核函数密度估计,现在我们要对这个概率密度分布来分析数据集合中密度最大的数据分布位置,首先对Kernel密度函数求导,

令导数=0,可以得到

则该x的位置就是概率密度最大的点位置。

我们令表示为Mean shift 向量,则有

因此,Mean shift 向量的平均偏移量(即梯度方向)会指向样本点最密的方向。Mean shift会转移到样本点相对变化最多的地方。而且离x越近的样本点对估计x周围的统计特性越重要,核函数的概念引入,可以理解为其实质就是每个样本点对x的权值贡献。可以打个比喻,想象一下几十匹马同时拉一辆车的恢弘场面(当然这辆车得够稳定,不会烂~),每匹马都往自己的方向拉,不过,距离x越近的马,其力量越大,最后的结果方向当然是朝着合力的方向移动,即如下图的黄色箭头方向。

Application I.  Image Segmentation:

本质上,mean shift解决问题都是基于转化为密度估计问题。对于图像应用,spatial信息有2维,range空间有p维。

图像分割中使用的多元核:

分别为坐标空间核和颜色空间核的带宽(bandwidth)。Discontinuity Preserving Smoothing滤波后的结果如下:

 

图像分割就是在滤波后对相同像素值的点进行聚类,分成M个区域。

Application II.  Tracking

基于Mean shift的目标跟踪算法通过分别计算目标区域和候选区域内像素的特征值概率,得到关于目标模型和候选模型的描述,然后利用相似函数度量初始帧目标模型和当前帧候选区域的相似性,选择相似函数最大的候选模型并得到关于目标模型的Mean shift向量,这个向量正是目标区域由初始位置向正确位置移动的位移向量。由于Mean shift算法的快速收敛性,通过不断迭代计算Mean shift向量,算法最后将可以收敛到目标的真实位置,从而达到Tracking目的。

Mean shift 跟踪结果

时间: 2024-10-10 09:21:54

计算机视觉总结(一)——Mean shift的相关文章

图像处理与计算机视觉基础,经典以及最近发展

*************************************************************************************************************** 在这里,我特别声明:本文章的源作者是   杨晓冬  (个人邮箱:[email protected]).原文的链接是 http://www.iask.sina.com.cn/u/2252291285/ish.版权归 杨晓冬 朋友所有. 我非常感谢原作者辛勤地编写本文章,并愿意共

Mean Shift具体介绍

Mean Shift,我们 翻译为“均值飘移”.其在聚类,图像平滑.图像切割和跟踪方面得到了比較广泛的应用.因为本人眼下研究跟踪方面的东西,故此主要介绍利用Mean Shift方法进行目标跟踪,从而对MeanShift有一个比較全面的介绍. (下面某些部分转载常峰学长的“Mean Shift概述”) Mean Shift 这个概念最早是由Fukunaga等人于1975年在一篇关于概率密度梯度函数的预计(The Estimation of the Gradient of a Density Fun

计算机视觉进展二十年 (1995~2015)

计算机视觉进展二十年 (1995~2015) 计算机视觉的两大主要板块是:几何和识别,这里我们主要来讲述计算机视觉在1995-2015年间的进展. 1. 影像特征点检测算子(detector)和描述算子(descriptor) SIFT的诞生 (1999, 2004) Scale invariant feature transform (SIFT) 是在1999年由 UBC 的教授 David Lowe 首次提出,并在2004年进一步完善并发表的 影像特征点检测 (detector) 和描述算子

计算机视觉算法与代码集锦

计算机视觉算法与代码集锦 计算机视觉是结合了传统摄影测量,现代计算机信息技术.人工智能等多学科的一个大学科,是一片开垦不足的大陆,路很远,但很多人都在跋涉! 本文转自CSDN(地址http://blog.csdn.net/whucv/article/details/7907391),是一篇很好的算法与代码总结文档,转载在此供大家学习参考. 原文如下: UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhua

UIUC同学Jia-Bin Huang收集的计算机视觉代码合集

[转载]UIUC同学Jia-Bin Huang收集的计算机视觉代码合集 原文地址:UIUC同学Jia-Bin Huang收集的计算机视觉代码合集作者:千里8848 UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html 这些代码很实用,可以让我们站在巨人的肩膀上~~ Topic Resources References Feature

计算机视觉与模式识别代码合集第二版two

Topic Name Reference code Image Segmentation Segmentation by Minimum Code Length AY Yang, J. Wright, S. Shankar Sastry, Y. Ma , Unsupervised Segmentation of Natural Images via Lossy Data Compression, CVIU, 2007 code Image Segmentation Normalized Cut

【计算机视觉】借助图像直方图来检测特定物(MeanShift、CamShift算法)

直方图引入 直方图是一个简单的表,它给出了一幅图像或一组图像中拥有给定数值的像素数量.因此,灰度图像的直方图有256个条目(或称为容器).0号容器给出值为0的像素数目,1号容器给出值为1的像素个数,以此类推. 直方图反投影 直方图是图像内容的一个重要特性.如果一幅图像的区域中显示的是一种独特的纹理或是一个独特的物体,那么这个区域的直方图可以看做一个概率函数,它给出的是某个像素属于该纹理或物体的概率.这使得我们可以借助图像的直方图来检测特定的内容. 反投影直方图的方法是一种把目标概率分布映射到观测

计算机视觉code与软件

Research Code A rational methodology for lossy compression - REWIC is a software-based implementation of a a rational system for progressive transmission which, in absence of a priori knowledge about regions of interest, choose at any truncation time

计算机视觉整理库

本文章有转载自其它博文,也有自己发现的新库添加进来的,如果发现有新的库,可以推荐我加进来 转自:http://www.cnblogs.com/tornadomeet/archive/2012/05/24/2515980.html Deep Learning(深度学习): ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一 ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二 Bengio团队的deep learning教程,用的thean