opencv2对读书笔记——使用均值漂移算法查找物体

一些小概念

1.反投影直方图的结果是一个概率映射，体现了已知图像内容出如今图像中特定位置的概率。

2.概率映射能够找到最初的位置，从最初的位置開始而且迭代移动，便能够找到精确的位置，这就是均值漂移算法做的事情。

3.均值漂移算法是以迭代的方式锁定函数的局部最大值的。

关于均值漂移算法的过程(opencv)

事实上均值漂移算法就是寻找提前定义寻找区域中数据点的重心，或者说加权平均值。将寻找区域中心移动到数据点的重心处，并反复这个过程直到寻找区域重心收敛到一个稳定点。

OpenCV中定义了两种终止条件：迭代最大次数以及窗体重心的位移值（低于该值即觉得算法收敛）。

在OpenCV中实现这个过程的是meanshift函数，其源码例如以下：

#include "_cv.h"

CV_IMPL int
cvMeanShift( const void* imgProb, CvRect windowIn,
             CvTermCriteria criteria, CvConnectedComp* comp )
{
    //CvMoments用来计算矩形的重心，面积等形状特征
    CvMoments moments;
    int    i = 0, eps;
    CvMat  stub, *mat = (CvMat*)imgProb;
    CvMat  cur_win;
    CvRect cur_rect = windowIn;

    CV_FUNCNAME( "cvMeanShift" );

    //初始化跟踪窗体
    if( comp )
        comp->rect = windowIn;

    //把0阶矩和1阶矩先初始化置零
    moments.m00 = moments.m10 = moments.m01 = 0;

    __BEGIN__;

    CV_CALL( mat = cvGetMat( mat, &stub ));

    //各种输入变量不符合要求时显示错误信息
    if( CV_MAT_CN( mat->type ) > 1 )
        CV_ERROR( CV_BadNumChannels, cvUnsupportedFormat );
    if( windowIn.height <= 0 || windowIn.width <= 0 )
        CV_ERROR( CV_StsBadArg, "Input window has non-positive sizes" );
    if( windowIn.x < 0 || windowIn.x + windowIn.width > mat->cols ||
        windowIn.y < 0 || windowIn.y + windowIn.height > mat->rows )
        CV_ERROR( CV_StsBadArg, "Initial window is not inside the image ROI" );

    //迭代的标准，精度=1.0，迭代次数=100
    CV_CALL( criteria = cvCheckTermCriteria( criteria, 1., 100 ));

    //精度eps=1
    eps = cvRound( criteria.epsilon * criteria.epsilon );

    //最大循环次数=最大迭代次数criteria.max_iter=100
    for( i = 0; i < criteria.max_iter; i++ )
    {
        int dx, dy, nx, ny;
        double inv_m00;

        //选取搜索区域，对该矩形区域计算它的0,1阶矩
        CV_CALL( cvGetSubRect( mat, &cur_win, cur_rect ));
        CV_CALL( cvMoments( &cur_win, &moments ));

        /* Calculating center of mass */
        if( fabs(moments.m00) < DBL_EPSILON )
            break;

        //搜索区域的质量m00
        inv_m00 = moments.inv_sqrt_m00*moments.inv_sqrt_m00;
        //搜索区域的水平重心偏移dx
        dx = cvRound( moments.m10 * inv_m00 - windowIn.width*0.5 );
        //搜索区域的垂直重心偏移dy
        dy = cvRound( moments.m01 * inv_m00 - windowIn.height*0.5 );

        //搜索区域的重心坐标(nx,ny)
        nx = cur_rect.x + dx;
        ny = cur_rect.y + dy;

        //跟踪目标处于图像边缘时进行一些对应的处理
        if( nx < 0 )
            nx = 0;
        else if( nx + cur_rect.width > mat->cols )
            nx = mat->cols - cur_rect.width;

        if( ny < 0 )
            ny = 0;
        else if( ny + cur_rect.height > mat->rows )
            ny = mat->rows - cur_rect.height;

        dx = nx - cur_rect.x;
        dy = ny - cur_rect.y;
        cur_rect.x = nx;
        cur_rect.y = ny;

        /* Check for coverage centers mass & window */
        //精度达到要求时就可以退出循环
        if( dx*dx + dy*dy < eps )
            break;
    }

    __END__;

    //对meanshift函数的返回值赋值
    if( comp )
    {
        comp->rect = cur_rect;
        comp->area = (float)moments.m00;
    }

    return i;
}

在里面我们能够非常easy的看出迭代过程

对这个算法想细致研究的同学能够參考一下Dorin Comaniciu 等人2002年写的：

《Mean Shift：A Robust Approach Toward Feature Space Analysis》

实际样例

样例代码

#include <opencv2\core\core.hpp>
#include <opencv2\highgui\highgui.hpp>
#include <opencv2\imgproc\imgproc.hpp>
#include <opencv2\video\tracking.hpp>

#include <iostream>
#include <vector>
using namespace std;

#include "objectFinder.h"
#include "colorhistogram.h"

int main()
{
	//读取參考图像
	cv::Mat image= cv::imread("../3.jpg");
	if (!image.data)
		return 0; 

	//定义查找物体
	cv::Mat imageROI= image(cv::Rect(85,200,64,64));
	cv::rectangle(image, cv::Rect(85,200,64,64),cv::Scalar(0,0,255));

	//显示參考图像
	cv::namedWindow("第一张图片，标记篮球位置");
	cv::imshow("第一张图片，标记篮球位置",image);

	//获得色度直方图
	ColorHistogram hc;
	cv::MatND colorhist= hc.getHueHistogram(imageROI);

	//读入目标图像
	image= cv::imread("../4.jpg");

	//显示目标图像
	cv::namedWindow("第二张图片");
	cv::imshow("第二张图片",image);

	//将RGB图像图像转换为HSV图像
	cv::Mat hsv;
	cv::cvtColor(image, hsv, CV_BGR2HSV);

	//分离图像通道
	vector<cv::Mat> v;
	cv::split(hsv,v);

	//消除饱和度较低的像素点
	int minSat=65;
	cv::threshold(v[1],v[1],minSat,255,cv::THRESH_BINARY);
	cv::namedWindow("第二张图片消除饱和度较低的像素点");
	cv::imshow("第二张图片消除饱和度较低的像素点",v[1]);

	//进行直方图反投影
	ObjectFinder finder;
	finder.setHistogram(colorhist);
	finder.setThreshold(0.3f);
	int ch[1]={0};
	cv::Mat result= finder.find(hsv,0.0f,180.0f,ch,1);

	cv::namedWindow("第二张图片进行直方图反投影");
	cv::imshow("第二张图片进行直方图反投影",result);

	//利用位运算消除低饱和度像素
	cv::bitwise_and(result,v[1],result);
	cv::namedWindow("第二张图片利用位运算进一步消除低饱和度像素点");
	cv::imshow("第二张图片利用位运算进一步消除低饱和度像素点",result);

	// 得到反投影直方图概率图像
	finder.setThreshold(-1.0f);
	result= finder.find(hsv,0.0f,180.0f,ch,1);
	cv::bitwise_and(result,v[1],result);
	cv::namedWindow("第二张图片处理后的二值图像");
	cv::imshow("第二张图片处理后的二值图像",result);

	cv::Rect rect(85,200,64,64);
	cv::rectangle(image, rect, cv::Scalar(0,0,255));

	cv::TermCriteria criteria(cv::TermCriteria::MAX_ITER,10,0.01);
	cout << "均值漂移迭代次数 = " << cv::meanShift(result,rect,criteria) << endl;

	cv::rectangle(image, rect, cv::Scalar(0,255,0));

	//展示结果图
	cv::namedWindow("查找结果，红框为第一幅图中篮球位置，绿框为现位置");
	cv::imshow("查找结果，红框为第一幅图中篮球位置，绿框为现位置",image);

	cv::waitKey();
	return 0;
}

输出结果

-END-

opencv2对读书笔记——使用均值漂移算法查找物体,布布扣,bubuko.com

时间： 2025-01-06 02:46:44

opencv2对读书笔记——使用均值漂移算法查找物体的相关文章

opencv2对读书笔记——图像二值化——thresholded函数

opencv中的图像二值化函数threshold函数其结构 double cv::threshold( //二值化函数 const CvArr* src, //原始图像 CvArr* dst, //输出图像 double threshold, //阈值 double max_value, //最大值 int threshold_type//阈值类型 ); 实例代码 #include "cv.h" #include "highgui.h" int main() {

opencv2对读书笔记——反投影直方图以检测待定的图像内容

一些小概念 1.直方图是图像内容的一个重要特性. 2.如果一幅图像的区域中显示的是一种独特的纹理或是一个独特的物体,那么这个区域的直方图可以看作是一个概率函数,它给出的是某个像素属于该纹理或物体的概率. 3.反投影直方图的作用是在于替换一个输入图像中每一个像素值,使其变成归一化直方图中对应的概率值. 这是一个什么样的过程名字听起来感觉很高端,其实这个一个很简单的过程. 1.首先我们截取一个区域,作为目标区域. 2.然后将目标区域取直方图,并将其直方图归一化,并得到这个区域的概率. 3.利用ca

[读书笔记]JVM的垃圾收集算法

1.标记-清除算法 (1)算法思想:第一步,标记好所有需要回收的对象:第二步,清除被标记的对象. (2)缺点:时间上,效率不高,无论是标记还是清除操作:空间上,会产生大量不连续的内存碎片,使得占用大内存的对象找不到足够的连续内存而进一步又提前触发一次GC. 标记-清除算法执行过程如下图所示: 2.复制算法 (1)算法思想:内存区分成两部分大小相等的区域.一半作为使用区,一半作为保留区.申请内存时,在使用区进行.GC时,我们将使用区的将被存活的对象复制到保留区,然后将使用区清空,这时我们将原使用区

机器学习实战读书笔记(二)k-近邻算法

knn算法: 1.优点:精度高.对异常值不敏感.无数据输入假定 2.缺点:计算复杂度高.空间复杂度高. 3.适用数据范围:数值型和标称型. 一般流程: 1.收集数据 2.准备数据 3.分析数据 4.训练算法:不适用 5.测试算法:计算正确率 6.使用算法:需要输入样本和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理. 2.1.1 导入数据 operator是排序时要用的 from numpy import * import operato

《大话数据结构》读书笔记——8.4.1折半查找

//c实现 1 #include "stdafx.h" 2 #include "stdlib.h" 3 4 5 int _tmain(int argc, _TCHAR* argv[]) 6 { 7 int a[10] = {0,1,3,4,6,7,9,11,12,15}; 8 int low,high,mid,key,flag; 9 key = 7;flag = -1; 10 low = 0;high = 10; 11 while(low<high) 12 {

数据结构与算法（刺猬书）读书笔记----目录

最近在抓底层的语言基础,以前对数据结构和算法并没有太大感觉,但越往深处学就越觉得这些基础真的是要牢牢掌握住.一个简简单单的数组,深究起来都有很多学问.所以打算写个一系列的读书笔记,好好梳理一下这一块的基础知识.这本书是<数据结构预算法JavaScript描述>,是基于JavaScript的.里面大致介绍了数组.列表.栈.队列.链表.散列.集合及各种常见基础算法.作为基础读物算是很全面的.这系列读书笔记也将会跟着书里的顺序一章章的进行梳理.整个过程计划耗时2-3个月,每周更新一到两张,更新的笔记

程序语言的奥妙：算法解读 ——读书笔记

算法(Algorithm) 是利用计算机解决问题的处理步骤. 算法是古老的智慧.如<孙子兵法>,是打胜仗的算法. 算法是古老智慧的结晶,是程序的范本. 学习算法才能编写出高质量的程序. 懂得了算法,游戏水平会更高. 比如下棋,如果懂得棋谱,就不需要每次考虑"寻找最好的一步棋",按照棋谱就可以走出最好的几步棋.棋谱是先人们智慧的结果,因此掌握多种棋谱的人更容易在对弈中获得胜利. 算法的学习类似学习游戏攻略. 算法是编写好程序的"棋谱". 算法必须满足&

算法导论读书笔记之钢条切割问题

算法导论读书笔记之钢条切割问题巧若拙(欢迎转载,但请注明出处:http://blog.csdn.net/qiaoruozhuo) 给定一段长度为n英寸的钢条和一个价格表 pi (i=1,2, -,n),求切割钢条的方案,使得销售收益rn最大.注意,如果长度为n英寸的钢条价格pn足够大,最优解可能就是完全不需要切割. 若钢条的长度为i,则钢条的价格为Pi,如何对给定长度的钢条进行切割能得到最大收益? 长度i 1 2 3 4 5 6 7 8

算法导论读书笔记（15） - 红黑树的具体实现

算法导论读书笔记(15) - 红黑树的具体实现目录红黑树的简单Java实现红黑树的简单Java实现 /** * 红黑树 * * 部分代码参考自TreeMap源码 */ public class RedBlackTree<T> { protected TreeNode<T> root = null; private final Comparator<? super T> comparator; private int size = 0; private static