计算机视觉总结（一）——Mean shift

在彻底了解mean shift之前，我们需要解决三个问题：

第一个问题：无参数密度估计

无参数密度估计，它对数据分布规律没有附加任何假设，而是直接从数据样本本身出发研究数据分布特征，对先验知识要求少，完全依靠训练数据进行估计，而且能够处理任意的概率分布。

eg. 直方图法，最近邻域法，核密度估计法。

而有参数密度估计有：高斯统计模型

举个例子：

有N个数据点，它们的坐标分布如下图所示，如何求出这个区域中，哪个位置的样本分布密度最大，换言之，如果来了第N+1个样本点，它最大的可能出现位置在哪里。

第二个问题：Kernel density estimation

给定维空间中的样本集合，则点关于核函数和带宽矩阵的核函数密度估计表示为：

其中

由于，可将密度估计写成关于核函数的轮廓函数形式：

由上面的公式可以看出，其实核函数密度估计最后可以看做成为一种权值函数，其作用是将每个样本点按与点x的距离远近进行加权，距离x点近的样本点概率密度估计影响大，赋予权值也越大；反之权值越小。

第三个问题：Mean shift 向量

从上轮可以得出对数据的核函数密度估计，现在我们要对这个概率密度分布来分析数据集合中密度最大的数据分布位置，首先对Kernel密度函数求导，

令导数=0，可以得到

则该x的位置就是概率密度最大的点位置。

我们令表示为Mean shift 向量，则有

因此，Mean shift 向量的平均偏移量（即梯度方向）会指向样本点最密的方向。Mean shift会转移到样本点相对变化最多的地方。而且离x越近的样本点对估计x周围的统计特性越重要，核函数的概念引入，可以理解为其实质就是每个样本点对x的权值贡献。可以打个比喻，想象一下几十匹马同时拉一辆车的恢弘场面（当然这辆车得够稳定，不会烂~），每匹马都往自己的方向拉，不过，距离x越近的马，其力量越大，最后的结果方向当然是朝着合力的方向移动，即如下图的黄色箭头方向。

Application I. Image Segmentation：

本质上，mean shift解决问题都是基于转化为密度估计问题。对于图像应用，spatial信息有2维，range空间有p维。

图像分割中使用的多元核：

分别为坐标空间核和颜色空间核的带宽（bandwidth）。Discontinuity Preserving Smoothing滤波后的结果如下：

图像分割就是在滤波后对相同像素值的点进行聚类，分成M个区域。

Application II. Tracking

基于Mean shift的目标跟踪算法通过分别计算目标区域和候选区域内像素的特征值概率，得到关于目标模型和候选模型的描述，然后利用相似函数度量初始帧目标模型和当前帧候选区域的相似性，选择相似函数最大的候选模型并得到关于目标模型的Mean shift向量，这个向量正是目标区域由初始位置向正确位置移动的位移向量。由于Mean shift算法的快速收敛性，通过不断迭代计算Mean shift向量，算法最后将可以收敛到目标的真实位置，从而达到Tracking目的。

Mean shift 跟踪结果

时间： 2024-10-10 09:21:54

计算机视觉总结（一）——Mean shift的相关文章

图像处理与计算机视觉基础，经典以及最近发展

*************************************************************************************************************** 在这里,我特别声明:本文章的源作者是杨晓冬 (个人邮箱:[email protected]).原文的链接是 http://www.iask.sina.com.cn/u/2252291285/ish.版权归杨晓冬朋友所有. 我非常感谢原作者辛勤地编写本文章,并愿意共

Mean Shift具体介绍

Mean Shift,我们翻译为“均值飘移”.其在聚类,图像平滑.图像切割和跟踪方面得到了比較广泛的应用.因为本人眼下研究跟踪方面的东西,故此主要介绍利用Mean Shift方法进行目标跟踪,从而对MeanShift有一个比較全面的介绍. (下面某些部分转载常峰学长的“Mean Shift概述”) Mean Shift 这个概念最早是由Fukunaga等人于1975年在一篇关于概率密度梯度函数的预计(The Estimation of the Gradient of a Density Fun

计算机视觉进展二十年 (1995~2015)

计算机视觉进展二十年 (1995~2015) 计算机视觉的两大主要板块是:几何和识别,这里我们主要来讲述计算机视觉在1995-2015年间的进展. 1. 影像特征点检测算子(detector)和描述算子(descriptor) SIFT的诞生 (1999, 2004) Scale invariant feature transform (SIFT) 是在1999年由 UBC 的教授 David Lowe 首次提出,并在2004年进一步完善并发表的影像特征点检测 (detector) 和描述算子

计算机视觉算法与代码集锦

计算机视觉算法与代码集锦计算机视觉是结合了传统摄影测量,现代计算机信息技术.人工智能等多学科的一个大学科,是一片开垦不足的大陆,路很远,但很多人都在跋涉! 本文转自CSDN(地址http://blog.csdn.net/whucv/article/details/7907391),是一篇很好的算法与代码总结文档,转载在此供大家学习参考. 原文如下: UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhua

UIUC同学Jia-Bin Huang收集的计算机视觉代码合集

[转载]UIUC同学Jia-Bin Huang收集的计算机视觉代码合集原文地址:UIUC同学Jia-Bin Huang收集的计算机视觉代码合集作者:千里8848 UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html 这些代码很实用,可以让我们站在巨人的肩膀上~~ Topic Resources References Feature

计算机视觉与模式识别代码合集第二版two

Topic Name Reference code Image Segmentation Segmentation by Minimum Code Length AY Yang, J. Wright, S. Shankar Sastry, Y. Ma , Unsupervised Segmentation of Natural Images via Lossy Data Compression, CVIU, 2007 code Image Segmentation Normalized Cut

【计算机视觉】借助图像直方图来检测特定物(MeanShift、CamShift算法)

直方图引入直方图是一个简单的表,它给出了一幅图像或一组图像中拥有给定数值的像素数量.因此,灰度图像的直方图有256个条目(或称为容器).0号容器给出值为0的像素数目,1号容器给出值为1的像素个数,以此类推. 直方图反投影直方图是图像内容的一个重要特性.如果一幅图像的区域中显示的是一种独特的纹理或是一个独特的物体,那么这个区域的直方图可以看做一个概率函数,它给出的是某个像素属于该纹理或物体的概率.这使得我们可以借助图像的直方图来检测特定的内容. 反投影直方图的方法是一种把目标概率分布映射到观测

计算机视觉code与软件

Research Code A rational methodology for lossy compression - REWIC is a software-based implementation of a a rational system for progressive transmission which, in absence of a priori knowledge about regions of interest, choose at any truncation time

计算机视觉整理库

本文章有转载自其它博文,也有自己发现的新库添加进来的,如果发现有新的库,可以推荐我加进来转自:http://www.cnblogs.com/tornadomeet/archive/2012/05/24/2515980.html Deep Learning(深度学习): ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一 ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二 Bengio团队的deep learning教程,用的thean

猜你喜欢

在eclipse中进行Struts2项目的配置

Struts2是一个比较出色的基于MVC设计模式的框架,是由Struts1和WebWork发展而来的,性能也比较稳定,现在是Apache软件基金会的一个项目,下面就来配置Struts2进行初始化的开发 ...

判断手机号码合法性

问题描述: 我国大陆运营商的手机号码标准格式为:国家码+手机号码,例如:8613912345678.特点如下: 1.长度13位: 2.以86的国家码打头: 3.手机号码的每一位都是数字. 请实现手机号 ...

PHP抽象接口析构方法

/*class Ren{ public static $color; static function Show() { Ren::$color;//用类名不仅可以调用自己的,还可以调用其他类的Car: ...

Java第二章总结

编程语言的基本组成:字符集.标识符.关键字.变量.常量.语句. cnost和goto不能再Java中使用. mian是一个用于描述Java程序的开始方法的特殊名称,但它不是一个关键字. JAVA标识符 ...

【转】JQuery选择器

原址:http://www.cnblogs.com/onlys/articles/jQuery.html jQuery 的选择器可谓之强大无比,这里简单地总结一下常用的元素查找方法 $(" ...

apache (web服务器) ->php->mysql，xampp与wamp比较

wamp环境 1.W:windows 2.A:APACHE 3.M:mysql 4. p:php wnmp环境 1.W:windows 2.A:APACHE 3.n nginx 4. p:php WA ...

线程安全的单例模式

1. 全局变量的缺点: 必须在程序一开始就创建好对象,如果程序在这次的执行过程中又一直没用到它,就非常耗费资源. 2. 经典的单例模式实现: Java代码 public class Singleton ...

JS 基础语法

基础语法 JS中的一切都区分大小写. 所谓标识符,是指变量.函数.属性的名字,或者函数的参数. 标识符的第一个字符不能是数字,可以是字母.下划线和美元符号:其它字符可以是数字. // 单行注释 /* ...

[BZOJ1031] [JSOI2007] 字符加密Cipher (后缀数组)

Description 喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考.一天,他突然想出了一种他认为是终极的加密办法 :把需要加密的信息排成一圈,显然,它们有很多种不同的读法.例如下图,可以读作 ...

iOS中中UIView头文件详细解析

@interface UIView : UIResponder<NSCoding, UIAppearance, UIAppearanceContainer, UIDynamicItem> ...

[rsync+inotify]——监控客户端文件变化，rsync同步到服务器

关于rsync的配置请参考博文:http://www.cnblogs.com/snsdzjlz320/p/5630695.html 实验环境 (1) Rsync服务器:10.0.10.158 (2) ...

Codeforces Round #344 (Div. 2)

水 A - Interview 注意是或不是异或 #include <bits/stdc++.h> int a[1005], b[1005]; int main() { int n; sc ...

刭们瓤手依jz1ahlku

http://imgur.com/a/QHh0Ghttp://imgur.com/a/QTYp0http://imgur.com/a/MPyBBhttp://imgur.com/a/7HHg9http ...

【转】微软MVP攻略（如何成为MVP？一个SQL Server MVP的经验之谈）

一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 初衷什么是微软MVP? 成为微软MVP的条件? 如何成为微软MVP? (一) 申请时间划分 (二) 前期准备 (三) ...

SOJ 1151. 魔板

题目大意:和soj 1150题目大意差不多,不过数据规模变大了,n可能大于10. 解题思路:在1150的基础上作修改,修改状态重复判断的方式.以前是:扫描整个队列,查重:现在是:引入set集合,每个元 ...

PHP教程之00----入门指引

PHP 是什么? PHP("PHP: Hypertext Preprocessor",超文本预处理器的字母缩写)是一种被广泛应用的开放源代码的多用途脚本语言,它可嵌入到 HTML中 ...

ELK-json型日志-特殊字段出现ERROR 字段报警配置文件

[[email protected] etc]# cat plat_interface_info.conf input { file { type => "234_pla ...

6.2.2认证

6.2.2.1为什么需要认证? 大多数NTP用户不需要认证因为协议本身包含了许多针对坏的时间的过滤器.然而,还是存在认证,并且认证的使用正在变得越来越常见.其中原因可能是: 你只想用来自可信事件源的时 ...

浅谈技术翻译（转自李松峰）

有的译者认为“技术书籍以技术引导为己任,最重要的是让读者入门然后去读英文原文,而不是要传承中华文化”,这种看法你认同吗? 首先,咱们先明确一下“技术书籍”这个概念.因为“技术”是一个很宽泛的词,必须先 ...

ssh无密码登陆权威指南

[0]写在前面由于ssh 实现的是免密码登陆,大致步骤是: 0.1) client通过ssh登陆到server: 0.2) server检查家目录下的.ssh文件, 并发送公钥文件 authoriz ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.