OpenCV2.4.9源码分析——Support Vector Machines

引言

本文共分为三个部分,第一个部分介绍SVM的原理,我们全面介绍了5中常用的SVM算法:C-SVC、ν-SVC、单类SVM、ε-SVR和ν-SVR,其中C-SVC和ν-SVC不仅介绍了处理两类分类问题的情况,还介绍处理多类问题的情况。在具体求解SVM过程中,我们介绍了SMO算法和广义SMO算法。第二个部分我们给出了OpenCV中SVM程序的详细注解。第三个部分我们给出了一个基于OpenCV的SVM算法的简单应用实例。

由于这篇文章太长,公式很多,把文章复制到这里,阅读体验会很差,因此,我把这篇文章的完整版上传到了百度文库:

http://wenku.baidu.com/view/5dcd95d8a76e58fafab003fe

大家可以在线阅读,也可以免费下载。在这里,我仅把源码分析部分和应用实例部分复制过来。

源码分析

OpenCV 2.4.9的SVM程序是基于LibSVMv2.6。LibSVM是由台湾大学林智仁等开发的用于SVM分类和回归的开源机器学习工具包。

在进行源码分析之前,我们先给出用于SVM算法的训练参数结构变量CvSVMParams:

struct CvSVMParams
{
    CvSVMParams();
    CvSVMParams( int _svm_type, int _kernel_type,
                 double _degree, double _gamma, double _coef0,
                 double _C, double _nu, double _p,
                 CvMat* _class_weights, CvTermCriteria _term_crit );

    int         svm_type;
    int         kernel_type;
    double      degree; // for poly
    double      gamma;  // for poly/rbf/sigmoid
    double      coef0;  // for poly/sigmoid

    double      C;  // for CV_SVM_C_SVC, CV_SVM_EPS_SVR and CV_SVM_NU_SVR
    double      nu; // for CV_SVM_NU_SVC, CV_SVM_ONE_CLASS, and CV_SVM_NU_SVR
    double      p; // for CV_SVM_EPS_SVR
    CvMat*      class_weights; // for CV_SVM_C_SVC
    CvTermCriteria term_crit; // termination criteria
};

svm_type表示OpenCV能够实现的SVM的类型:C-SVC、ν-SVC、单类SVM、ε-SVR和ν-SVR,对应的变量分别为:CvSVM::C_SVC、CvSVM::NU_SVC、CvSVM::ONE_CLASS、CvSVM::EPS_SVR和CvSVM::NU_SVR

kernel_type表示OpenCV能够实现的核函数的类型:线性核函数、多项式核函数、高斯核函数和Sigmoid核函数,对应的变量分别为:CvSVM::LINEAR、CvSVM::POLY、CvSVM::RBF和CvSVM::SIGMOID

degree表示多项式核函数(式54)中的参数q

gamma表示多项式核函数(式54)、高斯核函数(式56)和Sigmoid核函数(式57)中的参数γ

coef0表示多项式核函数(式54)和Sigmoid核函数(式57)中的参数p

C表示惩罚参数C

nu表示ν-SVC和ν-SVR的参数ν

p表示ε-SVR的参数ε

class_weights表示不同分类的权值,该值与参数C相乘后,实现了不同分类的不同惩罚力度,该值越大,该类别的误分类数据的惩罚就越大

term_crit:SVM表示广义SMO算法的迭代过程的终止条件,该变量是结构数据类型:

typedef struct CvTermCriteria
{
    //CV_TERMCRIT_ITER(表示使用迭代次数作为终止条件)和CV_TERMCRIT_EPS(表示使用精度作为终止条件)二值之一,或者二者的组合
    int  type;
    int  max_iter;    //最大迭代次数
    double  epsilon;    //结果的精确性
}

下面是类CvSVM的缺省构造函数:

CvSVM::CvSVM()
{
    decision_func = 0;    //表示决策函数,数据类型为CvSVMDecisionFunc
    class_labels = 0;    //表示分类问题的类标签
    class_weights = 0;    //表示分类问题的类别权重
    storage = 0;    //表示存储空间
    var_idx = 0;    //表示用到的特征属性的索引
    kernel = 0;    //表示核函数,数据类型为CvSVMKernel
    solver = 0;    //表示广义SMO算法的求解,数据类型为类CvSVMSolver
    default_model_name = "my_svm";

    clear();    //清空一些全局变量
}

下面是SVM的训练函数:

bool CvSVM::train( const CvMat* _train_data, const CvMat* _responses,
    const CvMat* _var_idx, const CvMat* _sample_idx, CvSVMParams _params )
//_train_data表示训练样本数据集
//_responses表示训练样本的响应值
//_var_idx表示真正用到的特征属性的索引
//_sample_idx表示真正用到的训练样本的索引
//_params表示SVM算法所需要的一些参数,如SVM的类型,核函数的类型等
{
    bool ok = false;    //用于该函数的正确返回标识
    CvMat* responses = 0;    //表示样本的响应值
    CvMemStorage* temp_storage = 0;    //暂存
    const float** samples = 0;    //表示完整的训练样本数据

    CV_FUNCNAME( "CvSVM::train" );

    __BEGIN__;
    //svm_type表示SVM类型,sample_count表示训练样本的数量,var_count表示特征属性的数量,sample_size表示训练样本的存储空间的尺寸大小
    int svm_type, sample_count, var_count, sample_size;
    int block_size = 1 << 16;    //先定义一个很大的存储空间的尺寸大小
    //表示拉格朗日乘子α,但我们在实际计算中,已经把5种SVM转换为统一的f(β)形式,因此这里的alpha表示的是式150、式151、式152、式154和式156中β,在后面的程序中,涉及到拉格朗日乘子α的,本质上指的都是β
    double* alpha; 

    clear();    //清空一些全局变量
    //调用set_params函数,为全局变量params赋值(它的数据类型为CvSVMParams,用于表示SVM算法所需的一些参数),并判断params中元素的正确性
    CV_CALL( set_params( _params ));

    svm_type = _params.svm_type;    //表示SVM的类型

    /* Prepare training data and related parameters */
    //调用cvPrepareTrainData函数,为SVM算法准备样本数据,即初始化样本。首先检查样本_train_data,该变量矩阵一定要是CV_ROW_SAMPLE,即矩阵的行表示样本,列表示特征属性;然后赋值样本响应值,如果SVM类型为CvSVM::ONE_CLASS,响应值为0,否则为_responses,并且如果SVM为CvSVM::C_SVC或CvSVM::NU_SVC,响应值_responses的类型为CV_VAR_CATEGORICAL,即为分类,否则为CV_VAR_ORDERED,即为回归;再根据_sample_idx和_var_idx确定那些真正要用到的样本数据以及那些真正要用到的特征属性;最终得到完整的样本数据samples。
    CV_CALL( cvPrepareTrainData( "CvSVM::train", _train_data, CV_ROW_SAMPLE,
                                 svm_type != CvSVM::ONE_CLASS ? _responses : 0,
                                 svm_type == CvSVM::C_SVC ||
                                 svm_type == CvSVM::NU_SVC ? CV_VAR_CATEGORICAL :
                                 CV_VAR_ORDERED, _var_idx, _sample_idx,
                                 false, &samples, &sample_count, &var_count, &var_all,
                                 &responses, &class_labels, &var_idx ));

    //得到训练样本的存储空间大小
    sample_size = var_count*sizeof(samples[0][0]);

    // make the storage block size large enough to fit all
    // the temporary vectors and output support vectors.
    //定义一个足够大的存储空间,用于满足所有的暂存向量和输出支持向量
    block_size = MAX( block_size, sample_count*(int)sizeof(CvSVMKernelRow));
    block_size = MAX( block_size, sample_count*2*(int)sizeof(double) + 1024 );
    block_size = MAX( block_size, sample_size*2 + 1024 );
    //下面三条语句虽然略有不同,但基本上实现的功能都是分配内存空间并初始化
    CV_CALL( storage = cvCreateMemStorage(block_size + sizeof(CvMemBlock) + sizeof(CvSeqBlock)));
    CV_CALL( temp_storage = cvCreateChildMemStorage(storage));
    CV_CALL( alpha = (double*)cvMemStorageAlloc(temp_storage, sample_count*sizeof(double)));
    // create_kernel函数的作用是通过参数params得到参数kernel,即得到核函数
    create_kernel();
    // create_solver函数的作用是实例化CvSVMSolver类,得到参数solver
    create_solver();
    //调用do_train函数,真正完成SVM训练任务,后面给出了该函数的详细讲解
    if( !do_train( svm_type, sample_count, var_count, samples, responses, temp_storage, alpha ))
        EXIT;
    //表示成功得到了SVM模型
    ok = true; // model has been trained succesfully

    __END__;
    //释放一些不再使用的变量和内存空间
    delete solver;
    solver = 0;
    cvReleaseMemStorage( &temp_storage );
    cvReleaseMat( &responses );
    cvFree( &samples );

    if( cvGetErrStatus() < 0 || !ok )
        clear();

    return ok;    //返回
}

do_train函数的详细讲解:

bool CvSVM::do_train( int svm_type, int sample_count, int var_count, const float** samples,
                    const CvMat* responses, CvMemStorage* temp_storage, double* alpha )
// svm_type表示SVM算法的类型
// sample_count表示训练样本的数量
// var_count表示特征属性的数量
// samples表示完整的训练样本数据
// responses表示训练样本的响应值
// temp_storage表示训练所需的内存空间
// alpha表示拉格朗日乘子α,实际为式148中的变量β
{
    bool ok = false;    //用于该函数的正确返回标识

    CV_FUNCNAME( "CvSVM::do_train" );

    __BEGIN__;

    CvSVMDecisionFunc* df = 0;    //表示SVM的决策函数
    const int sample_size = var_count*sizeof(samples[0][0]);    //定义样本空间大小
    int i, j, k;

    cvClearMemStorage( storage );    //清空storage内存空间

    if( svm_type == ONE_CLASS || svm_type == EPS_SVR || svm_type == NU_SVR )
    //如果SVM的类型为单类SVM、ε-SVR或ν-SVR
    {
        int sv_count = 0;    //表示支持向量的数量
        //为变量df(决策函数)分配内存空间,并把它的首地址指针指向变量decision_func
        CV_CALL( decision_func = df =
            (CvSVMDecisionFunc*)cvAlloc( sizeof(df[0]) ));

        df->rho = 0;    //初始化决策函数中的变量ρ,ρ实质为偏移量b
        //调用train1函数,该函数作用主要是根据SVM类型的不同,参数solver实现不同的SMO算法函数:类型为C_SVC,实现的是solver->solve_c_svc函数;类型为NU_SVC,实现的是solver->solve_nu_svc函数;类型为ONE_CLASS,实现的是solver->solve_one_class函数;类型为EPS_SVR,实现的是solver->solve_eps_svr函数;类型为NU_SVR,实现的是solver->solve_nu_svr函数。这5个函数在后面都会给出详细的讲解
        //在这里SVM的类型只能为ONE_CLASS、EPS_SVR或NU_SVR
        if( !train1( sample_count, var_count, samples, svm_type == ONE_CLASS ? 0 :
            responses->data.i, 0, 0, temp_storage, alpha, df->rho ))
            EXIT;
        //遍历所有训练样本,统计支持向量的数量,只有αi大于0的向量才是支持向量
        for( i = 0; i < sample_count; i++ )
            sv_count += fabs(alpha[i]) > 0;

        CV_Assert(sv_count != 0);    //确保不能没有支持向量

        sv_total = df->sv_count = sv_count;    //赋值支持向量的数量
        //为支持向量数据sv和拉格朗日乘子df->alpha开辟一块存储空间
        CV_CALL( df->alpha = (double*)cvMemStorageAlloc( storage, sv_count*sizeof(df->alpha[0])) );
        CV_CALL( sv = (float**)cvMemStorageAlloc( storage, sv_count*sizeof(sv[0])));
        //遍历训练样本
        for( i = k = 0; i < sample_count; i++ )
        {
            if( fabs(alpha[i]) > 0 )    //拉格朗日乘子αi大于0
            {
                //得到支持向量的样本数据sv,以及它所对应的αi值df->alpha
                CV_CALL( sv[k] = (float*)cvMemStorageAlloc( storage, sample_size ));
                memcpy( sv[k], samples[i], sample_size );
                df->alpha[k++] = alpha[i];
            }
        }
    }
    else    //SVM类型为C-SVC和ν-SVC,即分类问题
    {
        int class_count = class_labels->cols;    //得到样本的类别数量
        int* sv_tab = 0;    //用于标识某一样本是否为支持向量
        const float** temp_samples = 0;    //表示暂时需要使用的训练样本
        // class_ranges表示分类范围,例如有9个样本,共三类,并且已经按照响应值的大小进行了排序,结果为:1,1,1,2,2,3,3,3,3,则class_ranges[0]=0, class_ranges[1]=3, class_ranges[2]=5, class_ranges[3]=9,因此通过该变量很容易得到每类的样本数,以及它们的分布范围
        int* class_ranges = 0;
        schar* temp_y = 0;        //表示暂时需要使用的训练样本的分类标签
        //再次确认是分类问题
        assert( svm_type == CvSVM::C_SVC || svm_type == CvSVM::NU_SVC );
        //如果是C_SVC类型,并且初始化了变量params.class_weights
        if( svm_type == CvSVM::C_SVC && params.class_weights )
        {
            const CvMat* cw = params.class_weights;    //为类别权重赋值
            //判断类别权重cw的数据格式是否正确,即cw必须是一维的矩阵形式,即向量,向量的元素数量必须等于分类数量,并且数据类型必须为CV_32FC1或CV_64FC1
            if( !CV_IS_MAT(cw) || (cw->cols != 1 && cw->rows != 1) ||
                cw->rows + cw->cols - 1 != class_count ||
                (CV_MAT_TYPE(cw->type) != CV_32FC1 && CV_MAT_TYPE(cw->type) != CV_64FC1) )
                CV_ERROR( CV_StsBadArg, "params.class_weights must be 1d floating-point vector "
                    "containing as many elements as the number of classes" );
            //把cw赋值给全局变量class_weights
            CV_CALL( class_weights = cvCreateMat( cw->rows, cw->cols, CV_64F ));
            CV_CALL( cvConvert( cw, class_weights ));
            //实现了该等式:class_weights = class_weights × params.C
            CV_CALL( cvScale( class_weights, class_weights, params.C ));
        }
        //为变量df(决策函数)分配内存空间,并把它的首地址指针指向变量decision_func
        CV_CALL( decision_func = df = (CvSVMDecisionFunc*)cvAlloc(
            (class_count*(class_count-1)/2)*sizeof(df[0])));
        //分配内存空间给sv_tab,并清零
        CV_CALL( sv_tab = (int*)cvMemStorageAlloc( temp_storage, sample_count*sizeof(sv_tab[0]) ));
        memset( sv_tab, 0, sample_count*sizeof(sv_tab[0]) );
        //分配内存空间给class_ranges,temp_samples和temp_y
        CV_CALL( class_ranges = (int*)cvMemStorageAlloc( temp_storage,
                            (class_count + 1)*sizeof(class_ranges[0])));
        CV_CALL( temp_samples = (const float**)cvMemStorageAlloc( temp_storage,
                            sample_count*sizeof(temp_samples[0])));
        CV_CALL( temp_y = (schar*)cvMemStorageAlloc( temp_storage, sample_count));

        class_ranges[class_count] = 0;    //清零
        //调用cvSortSamplesByClasses函数,实现了按照响应值对样本进行升序排序,并得到了变量class_ranges
        cvSortSamplesByClasses( samples, responses, class_ranges, 0 );
        //check that while cross-validation there were the samples from all the classes
        //确保class_ranges[class_count]必须大于0,交叉验证时要用到
        if( class_ranges[class_count] <= 0 )
            CV_ERROR( CV_StsBadArg, "While cross-validation one or more of the classes have "
            "been fell out of the sample. Try to enlarge <CvSVMParams::k_fold>" );

        if( svm_type == NU_SVC )    //如果为NU_SVC类型
        {
            // check if nu is feasible
            //得到样本中任意两个类别的样本数,检查ν-SVC中的参数ν是否满足式66的条件
            for(i = 0; i < class_count; i++ )    //遍历样本的所有类别
            {
                int ci = class_ranges[i+1] - class_ranges[i];    //得到第i个类别的样本数量
                for( j = i+1; j< class_count; j++ )    //遍历当前类别以后的所有类别
                {
                    //得到第j个类别的样本数量,第j个类别在第i个类别的排序后面
                    int cj = class_ranges[j+1] - class_ranges[j];
                    //如果不满足式66的条件,则退出程序
                    if( params.nu*(ci + cj)*0.5 > MIN( ci, cj ) )
                    {
                        // !!!TODO!!! add some diagnostic
                        EXIT; // exit immediately; will release the model and return NULL pointer
                    }
                }
            }
        }

        // train n*(n-1)/2 classifiers
        //下面的for循环实现了一对一的多类SVC方法
        //得到n*(n-1)/2个SVM分类器,这里的n表示分类数,即class_count,每一个SVM分类器的信息都单独存储在自己的df变量中
        for( i = 0; i < class_count; i++ )    //遍历所有类别
        {
            for( j = i+1; j < class_count; j++, df++ )    //遍历当前分类以后的所有类别
            {
                //si和sj分别表示第i个类别和第j个类别在排序后样本的起始索引值
                //ci和cj分别表示第i个类别和第j个类别的样本数量
                int si = class_ranges[i], ci = class_ranges[i+1] - si;
                int sj = class_ranges[j], cj = class_ranges[j+1] - sj;
                //Cn和Cp分别表示负例和正例的惩罚参数
                double Cp = params.C, Cn = Cp;
                //k1用于计数索引,sv_count表示支持向量的数量
                int k1 = 0, sv_count = 0;

                for( k = 0; k < ci; k++ )    //遍历第i个类别的所有样本
                {
                    temp_samples[k] = samples[si + k];    //第i个类别的所有样本
                    temp_y[k] = 1;    //第i个类别的样本分类标签,设为1
                }

                for( k = 0; k < cj; k++ )    //遍历第j个类别的所有样本
                {
                    temp_samples[ci + k] = samples[sj + k];    //第j个类别的所有样本
                    temp_y[ci + k] = -1;    //第j个类别的样本分类标签,设为-1
                }

                if( class_weights )    //如果应用分类权重class_weights这个参数
                {
                    //Cp和Cn分别为加权后的第i个和第j个类别的惩罚参数
                    Cp = class_weights->data.db[i];
                    Cn = class_weights->data.db[j];
                }
                //调用train1函数,该函数作用主要是根据SVM类型的不同,参数solver实现不同的SMO算法函数:类型为C_SVC,实现的是solver->solve_c_svc函数;类型为NU_SVC,实现的是solver->solve_nu_svc函数;类型为ONE_CLASS,实现的是solver->solve_one_class函数;类型为EPS_SVR,实现的是solver->solve_eps_svr函数;类型为NU_SVR,实现的是solver->solve_nu_svr函数。这5个函数在后面都会给出详细的讲解
                //在这里SVM的类型只能为C_SVC或NU_SVC
                if( !train1( ci + cj, var_count, temp_samples, temp_y,
                             Cp, Cn, temp_storage, alpha, df->rho ))
                    EXIT;
                //遍历第i个和第j个类别的所有样本,得到当前分类器的支持向量数量
                for( k = 0; k < ci + cj; k++ )
                    sv_count += fabs(alpha[k]) > 0;

                df->sv_count = sv_count;    //赋值当前分类器的支持向量数量

                //为拉格朗日乘子df->alpha和支持向量索引df->sv_index开辟一块存储空间
                CV_CALL( df->alpha = (double*)cvMemStorageAlloc( temp_storage,
                                                sv_count*sizeof(df->alpha[0])));
                CV_CALL( df->sv_index = (int*)cvMemStorageAlloc( temp_storage,
                                                sv_count*sizeof(df->sv_index[0])));

                for( k = 0; k < ci; k++ )    //遍历第i个类别的样本
                {
                    if( fabs(alpha[k]) > 0 )    //拉格朗日乘子αi大于0
                    {
                        sv_tab[si + k] = 1;    //标注该样本为支持向量
                        //当前分类器的支持向量在样本序列的索引值
                        df->sv_index[k1] = si + k;
                        df->alpha[k1++] = alpha[k];    //赋值当前分类器的支持向量αi
                    }
                }

                for( k = 0; k < cj; k++ )    //遍历第j个类别的样本
                {
                    if( fabs(alpha[ci + k]) > 0 )    //拉格朗日乘子αi大于0
                    {
                        sv_tab[sj + k] = 1;    //标注该样本为支持向量
                        //当前分类器的支持向量在样本序列的索引值
                        df->sv_index[k1] = sj + k;
                        df->alpha[k1++] = alpha[ci + k];    //赋值当前分类器的支持向量αi
                    }
                }
            }
        }    //训练n*(n-1)/2个SVM分类器结束

        // allocate support vectors and initialize sv_tab
        for( i = 0, k = 0; i < sample_count; i++ )    //遍历所有训练样本
        {
            //在前面计算n*(n-1)/2个SVM分类器的过程中,无论对于哪一个分类器,只要某一样本为支持向量,它的sv_tab都为1,在这里sv_tab又被赋值为全部样本下支持向量的计数值,即当前支持向量是全部支持向量的第几个支持向量
            if( sv_tab[i] )
                sv_tab[i] = ++k;
        }

        sv_total = k;    //得到了支持向量的数量
        //为支持向量数据sv分配存储空间
        CV_CALL( sv = (float**)cvMemStorageAlloc( storage, sv_total*sizeof(sv[0])));

        for( i = 0, k = 0; i < sample_count; i++ )    //遍历所有样本
        {
            if( sv_tab[i] )    //如果当前样本是支持向量
            {
                //得到支持向量的样本数据sv
                CV_CALL( sv[k] = (float*)cvMemStorageAlloc( storage, sample_size ));
                memcpy( sv[k], samples[i], sample_size );
                k++;    //计数值累加
            }
        }

        df = (CvSVMDecisionFunc*)decision_func;    //决策函数的指针重新定位

        // set sv pointers
        //重新设置df->sv_index,以前变量df->sv_index[i]表示的是当前分类器的第i个支持向量在当前训练样本序列的索引值,而现在经过下面多重for循环,df->sv_index[i]表示的是当前分类器的第i个支持向量在全部训练样本中所有支持向量的第几个支持向量减1
        //再次遍历n*(n-1)/2个SVM分类器
        for( i = 0; i < class_count; i++ )    //遍历所有分类
        {
            for( j = i+1; j < class_count; j++, df++ )    //遍历当前分类以后的所有分类
            {
                //遍历当前SVM分类器的所有支持向量
                for( k = 0; k < df->sv_count; k++ )
                {
                    //为df->sv_index重新赋值
                    df->sv_index[k] = sv_tab[df->sv_index[k]]-1;
                    //确保df->sv_index的值必须小于所有支持向量的总数
                    assert( (unsigned)df->sv_index[k] < (unsigned)sv_total );
                }
            }
        }
    }
    //对于使用线性核函数的SVM来说,即式53,它们的支持向量是呈现线性的,因此只需用一个支持向量就可以代表所有的支持向量,这么可以简化SVM模型,optimize_linear_svm函数就实现了这个功能,该函数的详见讲解见后面
    optimize_linear_svm();
    ok = true;    //返回变量赋值

    __END__;

    return ok;    //函数返回
}

用于求解C-SVC类型的广义SMO算法:

bool CvSVMSolver::solve_c_svc( int _sample_count, int _var_count, const float** _samples, schar* _y,
                               double _Cp, double _Cn, CvMemStorage* _storage,
                               CvSVMKernel* _kernel, double* _alpha, CvSVMSolutionInfo& _si )
{
    int i;
    //调用create函数,用于设置广义SMO算法的参数,在后面给出该函数的详细讲解
    //对于C-SVC,select_working_set_func函数指针指向select_working_set,calc_rho_func函数指针指向calc_rho,get_row_func函数指针指向get_row_svc,_Cp和_Cn分别表示正例和负例的惩罚参数C
    if( !create( _sample_count, _var_count, _samples, _y, _sample_count,
                 _alpha, _Cp, _Cn, _storage, _kernel, &CvSVMSolver::get_row_svc,
                 &CvSVMSolver::select_working_set, &CvSVMSolver::calc_rho ))
        return false;
    //遍历所有样本,清空alpha数组,赋值b数组
    for( i = 0; i < sample_count; i++ )
    {
        alpha[i] = 0;    //α即为式148中的β,对于C-SVC,β初始化为0
        b[i] = -1;    //b即为式148中的p,对于C-SVC(式150),p为-1
    }
    //调用solve_generic,执行广义SMO算法的迭代过程,该函数在后面给出详细的讲解
    if( !solve_generic( _si ))
        return false;
    //遍历所有样本,使负例的β为负值,当再次用到alpha[i]时,会取绝对值,因此正负无所谓,这么做的好处是可以通过alpha[i]值,就能看出是正例还是负例
    for( i = 0; i < sample_count; i++ )
        alpha[i] *= y[i];

    return true;
}

用于求解ν-SVC类型的广义SMO算法:

bool CvSVMSolver::solve_nu_svc( int _sample_count, int _var_count, const float** _samples, schar* _y,
                                CvMemStorage* _storage, CvSVMKernel* _kernel,
                                double* _alpha, CvSVMSolutionInfo& _si )
{
    int i;
    double sum_pos, sum_neg, inv_r;
    //调用create函数,用于设置广义SMO算法的参数,在后面给出该函数的详细讲解
    //对于ν-SVC,select_working_set_func函数指针指向select_working_set_nu_svm,calc_rho_func函数指针指向calc_rho_nu_svm,get_row_func函数指针指向get_row_svc
    if( !create( _sample_count, _var_count, _samples, _y, _sample_count,
                 _alpha, 1., 1., _storage, _kernel, &CvSVMSolver::get_row_svc,
                 &CvSVMSolver::select_working_set_nu_svm, &CvSVMSolver::calc_rho_nu_svm ))
        return false;
    // sum_pos = sum_neg =νN/2,用于初始化β,详见原理部分的解释
    sum_pos = kernel->params->nu * sample_count * 0.5;
    sum_neg = kernel->params->nu * sample_count * 0.5;
    //遍历所有样本
    for( i = 0; i < sample_count; i++ )
    {
        if( y[i] > 0 )    //正例下,β的初始化
        {
            alpha[i] = MIN(1.0, sum_pos);
            sum_pos -= alpha[i];
        }
        else    //负例下,β的初始化
        {
            alpha[i] = MIN(1.0, sum_neg);
            sum_neg -= alpha[i];
        }
        b[i] = 0;    //b即为式148中的p,对于ν-SVC(式151),p为0
    }
    //调用solve_generic,执行广义SMO算法的迭代过程,该函数在后面给出详细的讲解
    if( !solve_generic( _si ))
        return false;
    //_si.r为原理部分式142下面段落中的ρ*,则inv_r就为1/ρ*
    inv_r = 1./_si.r;
    //遍历所有拉格朗日乘子,得到α=α*/ρ*
    for( i = 0; i < sample_count; i++ )
        alpha[i] *= y[i]*inv_r;

    _si.rho *= inv_r;    //得到b=b*/ρ*
    _si.obj *= (inv_r*inv_r);    //目标函数也要除以ρ*的平方
    _si.upper_bound_p = inv_r;    //赋值正界
    _si.upper_bound_n = inv_r;    //赋值负界

    return true;
}

用于求解单类SVM类型的广义SMO算法:

bool CvSVMSolver::solve_one_class( int _sample_count, int _var_count, const float** _samples,
                                   CvMemStorage* _storage, CvSVMKernel* _kernel,
                                   double* _alpha, CvSVMSolutionInfo& _si )
{
    int i, n;
    double nu = _kernel->params->nu;    //得到参数ν
    //调用create函数,用于设置广义SMO算法的参数,在后面给出该函数的详细讲解
    //对于单类SVM,select_working_set_func函数指针指向select_working_set,calc_rho_func函数指针指向calc_rho,get_row_func函数指针指向get_row_one_class
    if( !create( _sample_count, _var_count, _samples, 0, _sample_count,
                 _alpha, 1., 1., _storage, _kernel, &CvSVMSolver::get_row_one_class,
                 &CvSVMSolver::select_working_set, &CvSVMSolver::calc_rho ))
        return false;
    //为变量y分配空间
    y = (schar*)cvMemStorageAlloc( storage, sample_count*sizeof(y[0]) );
    n = cvRound( nu*sample_count );    //定义n=[vN]
    //遍历所有样本
    for( i = 0; i < sample_count; i++ )
    {
        y[i] = 1;    //单类SVM的所有样本的响应值都设为1
        b[i] = 0;    //b即为式148中的p,对于ν-SVC(式152),p为0
        alpha[i] = i < n ? 1 : 0;    //初始化β,详见原理部分的解释
    }
    //初始化因四舍五入而产生的小数部分对应的β
    if( n < sample_count )
        alpha[n] = nu * sample_count - n;
    else
        alpha[n-1] = nu * sample_count - (n-1);
    //调用solve_generic,执行广义SMO算法的迭代过程,该函数在后面给出详细的讲解
    return solve_generic(_si);
}

用于求解ε-SVR类型的广义SMO算法:

bool CvSVMSolver::solve_eps_svr( int _sample_count, int _var_count, const float** _samples,
                                 const float* _y, CvMemStorage* _storage,
                                 CvSVMKernel* _kernel, double* _alpha, CvSVMSolutionInfo& _si )
{
    int i;
    //p表示ε-SVR类型的参数ε,kernel_param_c表示惩罚参数C
    double p = _kernel->params->p, kernel_param_c = _kernel->params->C;
    //调用create函数,用于设置广义SMO算法的参数,在后面给出该函数的详细讲解
    //对于ε-SVR,select_working_set_func函数指针指向select_working_set,calc_rho_func函数指针指向calc_rho,get_row_func函数指针指向get_row_svr
    if( !create( _sample_count, _var_count, _samples, 0,
                 _sample_count*2, 0, kernel_param_c, kernel_param_c, _storage, _kernel, &CvSVMSolver::get_row_svr,
                 &CvSVMSolver::select_working_set, &CvSVMSolver::calc_rho ))
        return false;
    //为y和alpha开辟内存空间,它们的长度都为样本数量N的2倍
    y = (schar*)cvMemStorageAlloc( storage, sample_count*2*sizeof(y[0]) );
    alpha = (double*)cvMemStorageAlloc( storage, alpha_count*sizeof(alpha[0]) );
    //遍历所有样本,初始化参数
    for( i = 0; i < sample_count; i++ )
    {
        //前N个参数
        alpha[i] = 0;    //β初始化为0,前N个β即为α―
        //b即为式148中的p,对于ε-SVR(式154),前N个p为εeT-yT
        b[i] = p - _y[i];
        //y对应于式154中的z,对于ε-SVR(式154),前N个z为1
        y[i] = 1;
        //后N个参数
        alpha[i+sample_count] = 0;    //β初始化为0,后N个β即为α+
        //b即为式148中的p,对于ε-SVR(式154),后N个p为εeT+yT
        b[i+sample_count] = p + _y[i];
        //y对应于式154中的z,对于ε-SVR(式154),后N个z为-1
        y[i+sample_count] = -1;
    }
    //调用solve_generic,执行广义SMO算法的迭代过程,该函数在后面给出详细的讲解
    if( !solve_generic( _si ))
        return false;
    //遍历所有样本,计算ε-SVR的决策函数(式105)中核函数前的系数α――α+
    for( i = 0; i < sample_count; i++ )
        _alpha[i] = alpha[i] - alpha[i+sample_count];

    return true;
}

用于求解ν-SVR类型的广义SMO算法:

bool CvSVMSolver::solve_nu_svr( int _sample_count, int _var_count, const float** _samples,
                                const float* _y, CvMemStorage* _storage,
                                CvSVMKernel* _kernel, double* _alpha, CvSVMSolutionInfo& _si )
{
    int i;
    // kernel_param_c表示惩罚参数C
    double kernel_param_c = _kernel->params->C, sum;
    //调用create函数,用于设置广义SMO算法的参数,在后面给出该函数的详细讲解
    //对于ν-SVR,select_working_set_func函数指针指向select_working_set_nu_svm,calc_rho_func函数指针指向calc_rho_nu_svm,get_row_func函数指针指向get_row_svr
    if( !create( _sample_count, _var_count, _samples, 0,
                 _sample_count*2, 0, 1., 1., _storage, _kernel, &CvSVMSolver::get_row_svr,
                 &CvSVMSolver::select_working_set_nu_svm, &CvSVMSolver::calc_rho_nu_svm ))
        return false;
    //为y和alpha开辟内存空间,它们的长度都为样本数量N的2倍
    y = (schar*)cvMemStorageAlloc( storage, sample_count*2*sizeof(y[0]) );
    alpha = (double*)cvMemStorageAlloc( storage, alpha_count*sizeof(alpha[0]) );
    //sum = CνN/2
    sum = kernel_param_c * _kernel->params->nu * sample_count * 0.5;
    //遍历所有样本,初始化参数
    for( i = 0; i < sample_count; i++ )
    {
        //初始化β,详见原理部分的解释
        alpha[i] = alpha[i + sample_count] = MIN(sum, kernel_param_c);
        sum -= alpha[i];
        //b即为式148中的p,对于ν-SVR(式156),前N个p为-yT
        b[i] = -_y[i];
        //y对应于式156中的z,对于ν-SVR(式156),前N个z为1
        y[i] = 1;
        //b即为式148中的p,对于ν-SVR(式156),后N个p为yT
        b[i + sample_count] = _y[i];
        //y对应于式156中的z,对于ν-SVR(式156),后N个z为-1
        y[i + sample_count] = -1;
    }
    //调用solve_generic,执行广义SMO算法的迭代过程,该函数在后面给出详细的讲解
    if( !solve_generic( _si ))
        return false;
    //遍历所有样本,计算ν-SVR的决策函数(式116)中核函数前的系数α――α+
    for( i = 0; i < sample_count; i++ )
        _alpha[i] = alpha[i] - alpha[i+sample_count];

    return true;
}

create函数主要用于初始化和设置广义SMO算法的一些参数:

bool CvSVMSolver::create( int _sample_count, int _var_count, const float** _samples, schar* _y,
                int _alpha_count, double* _alpha, double _Cp, double _Cn,
                CvMemStorage* _storage, CvSVMKernel* _kernel, GetRow _get_row,
                SelectWorkingSet _select_working_set, CalcRho _calc_rho )
//_sample_count表示训练样本的数量
//_var_count表示特征属性的数量
//_samples表示训练样本的数据集
//_y表示样本的响应值
//_alpha_count表示拉格朗日乘子αi的数量
//_alpha表示拉格朗日乘子αi的值
//_Cp表示对于SVC的正例的惩罚参数
//_Cn表示对于SVC的负例的惩罚参数
//_storage表示一块存储空间
//_kernel表示核函数
//_get_row表示得到矩阵Q的列的首地址
//_select_working_set表示选取工作集βi和βj
//_calc_rho表示计算ρ
{
    bool ok = false;    //该函数返回的标识变量
    int i, svm_type;    //svm_type表示SVM类型

    CV_FUNCNAME( "CvSVMSolver::create" );

    __BEGIN__;

    int rows_hdr_size;    //矩阵Q的列的首地址指针尺寸大小

    clear();    //清空一些全局变量

    sample_count = _sample_count;    //训练样本的数量
    var_count = _var_count;    //特征属性的数量
    samples = _samples;    //训练样本
    y = _y;    //样本响应值
    alpha_count = _alpha_count;    //拉格朗日乘子αi的数量
    alpha = _alpha;    //拉格朗日乘子αi的值
    kernel = _kernel;    //核函数

    C[0] = _Cn;    //负例的惩罚参数
    C[1] = _Cp;    //正例的惩罚参数
    eps = kernel->params->term_crit.epsilon;    //表示式170和式171中的ε
    max_iter = kernel->params->term_crit.max_iter;    //表示最大迭代次数
    storage = cvCreateChildMemStorage( _storage );    //开辟内存空间
    //为变量b,alpha_status,G和buf开辟内存空间
    //b表示式148中的参数p;alpha_status表示拉格朗日乘子αi(实质是βi)的状态,即βi是下界(βi=0),上界(βi=C),还是其他;G表示式149;buf在函数get_row调用时会用到
    b = (double*)cvMemStorageAlloc( storage, alpha_count*sizeof(b[0]));
    alpha_status = (schar*)cvMemStorageAlloc( storage, alpha_count*sizeof(alpha_status[0]));
    G = (double*)cvMemStorageAlloc( storage, alpha_count*sizeof(G[0]));
    for( i = 0; i < 2; i++ )
        buf[i] = (Qfloat*)cvMemStorageAlloc( storage, sample_count*2*sizeof(buf[i][0]) );
    svm_type = kernel->params->svm_type;    //SVM类型
    //函数指针赋值,该函数的作用是选择工作集βi和βj
    select_working_set_func = _select_working_set;
    //如果函数指针select_working_set_func没有被赋值,则根据SVM的类型来确定该函数
    if( !select_working_set_func )
        //如果是ν-SVC或ν-SVR,select_working_set_func = select_working_set_nu_svm;如果是C-SVC、单类SVM或ε-SVR,select_working_set_func= select_working_set
        select_working_set_func = svm_type == CvSVM::NU_SVC || svm_type == CvSVM::NU_SVR ?
        &CvSVMSolver::select_working_set_nu_svm : &CvSVMSolver::select_working_set;
    //函数指针赋值,作用是计算ρ,即b
    calc_rho_func = _calc_rho;
    //如果函数指针calc_rho_func没有被赋值,则根据SVM的类型来确定该函数
    if( !calc_rho_func )
        //如果是ν-SVC或ν-SVR,calc_rho_func = calc_rho_nu_svm;如果是C-SVC、单类SVM或ε-SVR,calc_rho_func = calc_rho
        calc_rho_func = svm_type == CvSVM::NU_SVC || svm_type == CvSVM::NU_SVR ?
            &CvSVMSolver::calc_rho_nu_svm : &CvSVMSolver::calc_rho;
    //函数指针赋值,作用是得到矩阵Q的列首地址
    get_row_func = _get_row;
    //如果函数指针get_row_func没有被赋值,则根据SVM的类型来确定该函数
    if( !get_row_func )
        //如果是ε-SVR或ν-SVR,get_row_func = get_row_svr;如果是C-SVC或ν-SVC,get_row_func = get_row_svc;如果是单类SVM,get_row_func = get_row_one_class
        get_row_func = params->svm_type == CvSVM::EPS_SVR ||
                       params->svm_type == CvSVM::NU_SVR ? &CvSVMSolver::get_row_svr :
                       params->svm_type == CvSVM::C_SVC ||
                       params->svm_type == CvSVM::NU_SVC ? &CvSVMSolver::get_row_svc :
                       &CvSVMSolver::get_row_one_class;
    //定义cache_line_size和cache_size的大小,主要用于get_row_func函数
    cache_line_size = sample_count*sizeof(Qfloat);
    // cache size = max(num_of_samples^2*sizeof(Qfloat)*0.25, 64Kb)
    // (assuming that for large training sets ~25% of Q matrix is used)
    cache_size = MAX( cache_line_size*sample_count/4, CV_SVM_MIN_CACHE_SIZE );

    // the size of Q matrix row headers
    //定义rows_hdr_size大小
    rows_hdr_size = sample_count*sizeof(rows[0]);
    if( rows_hdr_size > storage->block_size )
        CV_ERROR( CV_StsOutOfRange, "Too small storage block size" );
    //定义lru_list变量
    lru_list.prev = lru_list.next = &lru_list;
    rows = (CvSVMKernelRow*)cvMemStorageAlloc( storage, rows_hdr_size );
    memset( rows, 0, rows_hdr_size );

    ok = true;    //设置正确返回变量

    __END__;

    return ok;    //返回
}

广义SMO算法的迭代过程:

bool CvSVMSolver::solve_generic( CvSVMSolutionInfo& si )
{
    int iter = 0;    //用于记录迭代的次数
    int i, j, k;

    // 1. initialize gradient and alpha status
    //遍历所有拉格朗日乘子αi,得到αi的状态,程序中的α实质是式148的β
    for( i = 0; i < alpha_count; i++ )
    {
/****************
#define update_alpha_status(i)     alpha_status[i] = (schar)(alpha[i] >= get_C(i) ? 1 : alpha[i] <= 0 ? -1 : 0)
****************/
        //宏定义update_alpha_status表示得到拉格朗日乘子αi的状态:当αi等于惩罚参数C时,alpha_status[i]等于1;当αi=0时,alpha_status[i]等于-1;当0<αi<C时,alpha_status[i]等于0。其中宏定义get_C表示得到正例和负例的惩罚参数C
        update_alpha_status(i);
        G[i] = b[i];    //式149,先初始化梯度为p,数组b已经被赋值为向量p
        if( fabs(G[i]) > 1e200 )    //确保变量G[i]不能过大
            return false;
    }

    for( i = 0; i < alpha_count; i++ )    //遍历所有拉格朗日乘子αi
    {
/*******************
#define is_lower_bound(i) (alpha_status[i] < 0)
#define is_upper_bound(i) (alpha_status[i] > 0)
*******************/
        //宏定义is_lower_bound用于表示αi是否为下界,即是否等于0,如果等于0,则is_lower_bound为1,否则为0;宏定义is_upper_bound用于表示αi是否为上界,即是否等于C,如果等于C,则is_upper_bound为1,否则为0
        if( !is_lower_bound(i) )    //如果αi≠0
        {
            //函数get_row表示得到矩阵Q的第i列首地址,Q即为式148中的Q,虽然Qij都可以表示为zizjK(xi, xj),但不同类型的SVM的zi含义不同,因此在get_row函数内,先通过get_row_base函数得到核函数K(xi, xj)的第i列,然后再调用get_row_func函数,前面已经分析过了,不同的SVM,get_row_func函数的函数指针会指向不同的函数
            const Qfloat *Q_i = get_row( i, buf[0] );
            double alpha_i = alpha[i];    //得到αi值,实质为βi
            //计算式149,得到f(β)的梯度向量▽f(β),G[j]表示▽f(β)向量的第j个元素
            for( j = 0; j < alpha_count; j++ )
                G[j] += alpha_i*Q_i[j];
        }
    }

    // 2. optimization loop
    for(;;)    //优化β的迭代死循环
    {
        // Q_i和Q_j分别表示式148中的Q的第i列和第j列的首地址
        const Qfloat *Q_i, *Q_j;
        //C_i和C_j分别表示第i个和第j个样本所对应的惩罚参数C,如图10所示
        double C_i, C_j;
        //old_alpha_i、old_alpha_j、alpha_i和alpha_j分别表示式161中βik、βjk、βinew和βjnew
        double old_alpha_i, old_alpha_j, alpha_i, alpha_j;
        // delta_alpha_i和delta_alpha_j分别表示每次迭代前后的βi的差值和βj的差值
        double delta_alpha_i, delta_alpha_j;

#ifdef _DEBUG
        for( i = 0; i < alpha_count; i++ )
        {
            if( fabs(G[i]) > 1e+300 )
                return false;

            if( fabs(alpha[i]) > 1e16 )
                return false;
        }
#endif
        //当满足终止条件或超过最大迭代次数,则退出迭代死循环
        // select_working_set_func函数用于工作集βi和βj的选取,如果该函数的返回值为1,则表示终止迭代循环,max_iter表示最大迭代次数。前面已经分析过,不同的SVM,select_working_set_func函数的函数指针会指向不同的函数,第一类SVM指向的是select_working_set函数,第二类SVM指向的是select_working_set_nu_svm,这两个函数在后面都会给出详细的讲解
        if( (this->*select_working_set_func)( i, j ) != 0 || iter++ >= max_iter )
            break;
        //分别得到矩阵Q的第i列和第j列的首地址
        Q_i = get_row( i, buf[0] );
        Q_j = get_row( j, buf[1] );
        //分别得到第i个和第j个样本的C值
        C_i = get_C(i);
        C_j = get_C(j);
        //分别得到第i个和第j个样本的β值
        alpha_i = old_alpha_i = alpha[i];
        alpha_j = old_alpha_j = alpha[j];

        if( y[i] != y[j] )    //zi≠zj时,式160中的第1行
        {
            double denom = Q_i[i]+Q_j[j]+2*Q_i[j];    //得到式160中第1行的aij
            //得到式162中分式的分子部分,即-▽if(β)-▽jf(β)
            double delta = (-G[i]-G[j])/MAX(fabs(denom),FLT_EPSILON);
            double diff = alpha_i - alpha_j;    //得到式164中的T
            //得到式162中的βinew和βjnew
            alpha_i += delta;
            alpha_j += delta;
            //如图10(a),限制β的值在矩形区域内
            if( diff > 0 && alpha_j < 0 )    //区域Ⅲ
            {
                alpha_j = 0;
                alpha_i = diff;
            }
            else if( diff <= 0 && alpha_i < 0 )    //区域Ⅳ
            {
                alpha_i = 0;
                alpha_j = -diff;
            }

            if( diff > C_i - C_j && alpha_i > C_i )    //区域Ⅰ
            {
                alpha_i = C_i;
                alpha_j = C_i - diff;
            }
            else if( diff <= C_i - C_j && alpha_j > C_j )    //区域Ⅱ
            {
                alpha_j = C_j;
                alpha_i = C_j + diff;
            }
        }
        else    //zi=zj时,式160中的第2行
        {
            double denom = Q_i[i]+Q_j[j]-2*Q_i[j];    //得到式160中第2行的ats
            //得到式163中分式的分子部分,即▽if(β)-▽jf(β)
            double delta = (G[i]-G[j])/MAX(fabs(denom),FLT_EPSILON);
            double sum = alpha_i + alpha_j;    //得到式165中的S
            //得到式163中的βinew和βjnew
            alpha_i -= delta;
            alpha_j += delta;
            //如图10(b),限制β的值在矩形区域内
            if( sum > C_i && alpha_i > C_i )    //区域Ⅰ
            {
                alpha_i = C_i;
                alpha_j = sum - C_i;
            }
            else if( sum <= C_i && alpha_j < 0)    //区域Ⅱ
            {
                alpha_j = 0;
                alpha_i = sum;
            }

            if( sum > C_j && alpha_j > C_j )    //区域Ⅲ
            {
                alpha_j = C_j;
                alpha_i = sum - C_j;
            }
            else if( sum <= C_j && alpha_i < 0 )    //区域Ⅳ
            {
                alpha_i = 0;
                alpha_j = sum;
            }
        }

        // update alpha
        //更新βi和βj,以及它们的状态
        alpha[i] = alpha_i;
        alpha[j] = alpha_j;
        update_alpha_status(i);
        update_alpha_status(j);

        // update G
        //得到迭代前后βi的差值和βj的差值
        delta_alpha_i = alpha_i - old_alpha_i;
        delta_alpha_j = alpha_j - old_alpha_j;
        //更新▽f(β)
        for( k = 0; k < alpha_count; k++ )
            G[k] += Q_i[k]*delta_alpha_i + Q_j[k]*delta_alpha_j;
    }    //迭代优化结束

    // calculate rho
    // calc_rho_func函数计算ρ,即决策函数中的参数b。前面已经分析过,不同类型的SVM,calc_rho_func函数的函数指针会指向不同的函数,第一类SVM指向的是calc_rho函数,第二类SVM指向的是calc_rho_nu_svm,这两个函数在后面都会给出详细的讲解
    (this->*calc_rho_func)( si.rho, si.r );

    // calculate objective value
    //计算式148,得到目标函数f(β)的值
    //f(β)=0.5×[βT×(▽f(β)+p)]=0.5×[βT×(Qβ+p)+p)]=0.5×βTQβ+pTβ
    for( i = 0, si.obj = 0; i < alpha_count; i++ )
        si.obj += alpha[i] * (G[i] + b[i]);

    si.obj *= 0.5;

    si.upper_bound_p = C[1];    //正例的惩罚参数C
    si.upper_bound_n = C[0];    //负例的惩罚参数C

    return true;
}

第一类SVM(C-SVC、单类SVM和ε-SVR)的选取工作集βiβj的函数:

bool
CvSVMSolver::select_working_set( int& out_i, int& out_j )
//out_i和out_j分别表示βi和βj
{
    // return i,j which maximize -grad(f)^T d , under constraint
    // if alpha_i == C, d != +1
    // if alpha_i == 0, d != -1
    //定义一个最大值
    double Gmax1 = -DBL_MAX;        // max { -grad(f)_i * d | y_i*d = +1 }
    int Gmax1_idx = -1;    //初始化i=-1
    //定义一个最大值
    double Gmax2 = -DBL_MAX;        // max { -grad(f)_i * d | y_i*d = -1 }
    int Gmax2_idx = -1;    //初始化j=-1

    int i;
    //遍历所有β
    for( i = 0; i < alpha_count; i++ )
    {
        double t;

        if( y[i] > 0 )    // y = +1,即式166中的zt=1
        {
            if( !is_upper_bound(i) && (t = -G[i]) > Gmax1 )  // d = +1
            //表示满足式166中的第一行max中的第一项
            {
                Gmax1 = t;    //更新最大值
                Gmax1_idx = i;    //得到工作集中第一个βi的索引值i
            }
            if( !is_lower_bound(i) && (t = G[i]) > Gmax2 )  // d = -1
            //表示满足式166中的第二行max中的第二项
            {
                Gmax2 = t;    //更新最大值
                Gmax2_idx = i;    //得到工作集中第二个βj的索引值j
            }
        }
        else        // y = -1,即式166中的zt=-1
        {
            if( !is_upper_bound(i) && (t = -G[i]) > Gmax2 )  // d = +1
            //表示满足式166中的第二行max中的第一项
            {
                Gmax2 = t;    //更新最大值
                Gmax2_idx = i;    //得到工作集中第二个βj的索引值j
            }
            if( !is_lower_bound(i) && (t = G[i]) > Gmax1 )  // d = -1
            //表示满足式166中的第一行max中的第二项
            {
                Gmax1 = t;    //更新最大值
                Gmax1_idx = i;    //得到工作集中第一个βi的索引值i
            }
        }
    }
    //为βi和βj赋值
    out_i = Gmax1_idx;
    out_j = Gmax2_idx;
    //式170,判断迭代是否终止
    return Gmax1 + Gmax2 < eps;
}

第二类SVM(ν-SVC和ν-SVR)的选取工作集βiβj的函数:

bool
CvSVMSolver::select_working_set_nu_svm( int& out_i, int& out_j )
{
    // return i,j which maximize -grad(f)^T d , under constraint
    // if alpha_i == C, d != +1
    // if alpha_i == 0, d != -1
    //定义一个最大值
    double Gmax1 = -DBL_MAX;    // max { -grad(f)_i * d | y_i = +1, d = +1 }
    int Gmax1_idx = -1;    //初始化ip

    double Gmax2 = -DBL_MAX;    // max { -grad(f)_i * d | y_i = +1, d = -1 }
    int Gmax2_idx = -1;    //初始化jp

    double Gmax3 = -DBL_MAX;    // max { -grad(f)_i * d | y_i = -1, d = +1 }
    int Gmax3_idx = -1;    //初始化in

    double Gmax4 = -DBL_MAX;    // max { -grad(f)_i * d | y_i = -1, d = -1 }
    int Gmax4_idx = -1;    //初始化jn

    int i;
    //遍历所有β
    for( i = 0; i < alpha_count; i++ )
    {
        double t;

        if( y[i] > 0 )    // y == +1
        //第一次由zi=1这个条件得到ip和jp
        {
            if( !is_upper_bound(i) && (t = -G[i]) > Gmax1 )  // d = +1
            //式167的第一行公式
            {
                Gmax1 = t;    //更新最大值
                Gmax1_idx = i;    //得到ip
            }
            if( !is_lower_bound(i) && (t = G[i]) > Gmax2 )  // d = -1
            //式167的第二行公式
            {
                Gmax2 = t;    //更新最大值
                Gmax2_idx = i;    //得到jp
            }
        }
        else        // y == -1
        //第二次由zi=-1这个条件得到in和jn
        {
            if( !is_upper_bound(i) && (t = -G[i]) > Gmax3 )  // d = +1
            //式168的第一行公式
            {
                Gmax3 = t;    //更新最大值
                Gmax3_idx = i;    //得到in
            }
            if( !is_lower_bound(i) && (t = G[i]) > Gmax4 )  // d = -1
            //式168的第二行公式
            {
                Gmax4 = t;    //更新最大值
                Gmax4_idx = i;    //得到jn
            }
        }
    }
    //式171,判断迭代是否终止
    if( MAX(Gmax1 + Gmax2, Gmax3 + Gmax4) < eps )
        return 1;
    //得到最终的工作集βi和βj
    if( Gmax1 + Gmax2 > Gmax3 + Gmax4 )    //式169的第一行公式
    {
        out_i = Gmax1_idx;
        out_j = Gmax2_idx;
    }
    else    //式169的第二行公式
    {
        out_i = Gmax3_idx;
        out_j = Gmax4_idx;
    }
    return 0;
}

第一类SVM(C-SVC、单类SVM和ε-SVR)的计算决策函数中参数b的函数:

void
CvSVMSolver::calc_rho( double& rho, double& r )
{
    int i, nr_free = 0;
    double ub = DBL_MAX, lb = -DBL_MAX, sum_free = 0;
    //遍历所有β
    for( i = 0; i < alpha_count; i++ )
    {
        double yG = y[i]*G[i];    //式172的分子中的一项

        if( is_lower_bound(i) )    //βi=0
        {
            if( y[i] > 0 )
                ub = MIN(ub,yG);    //式175中min的前一项内容
            else
                lb = MAX(lb,yG);    //式174中max的前一项内容
        }
        else if( is_upper_bound(i) )    //βi=C
        {
            if( y[i] < 0)
                ub = MIN(ub,yG);    //式175中min的后一项内容
            else
                lb = MAX(lb,yG);    //式174中max的后一项内容
        }
        else    //0<βi<C
        {
            ++nr_free;    //式172的分母,即计数
            sum_free += yG;    //式172的分子求和
        }
    }
    //如果nr_free大于0,说明有样本的βi的值在0和C之间,则利用式172计算ρ;否则利用式173计算ρ
    rho = nr_free > 0 ? sum_free/nr_free : (ub + lb)*0.5;
    r = 0;
}

第二类SVM(ν-SVC和ν-SVR)的计算决策函数中参数b的函数:

void
CvSVMSolver::calc_rho_nu_svm( double& rho, double& r )
{
    int nr_free1 = 0, nr_free2 = 0;
    double ub1 = DBL_MAX, ub2 = DBL_MAX;
    double lb1 = -DBL_MAX, lb2 = -DBL_MAX;
    double sum_free1 = 0, sum_free2 = 0;
    double r1, r2;

    int i;
    //遍历所有β
    for( i = 0; i < alpha_count; i++ )
    {
        double G_i = G[i];    //得到▽if(β)
        if( y[i] > 0 )
        {
            if( is_lower_bound(i) )    //式178分子中的第二项
                ub1 = MIN( ub1, G_i );
            else if( is_upper_bound(i) )    //式178分子中的第一项
                lb1 = MAX( lb1, G_i );
            else    //式176
            {
                ++nr_free1;    //式176的分母,即计数
                sum_free1 += G_i;    //式176的分子,求和
            }
        }
        else
        {
            if( is_lower_bound(i) )    //式179分子中的第二项
                ub2 = MIN( ub2, G_i );
            else if( is_upper_bound(i) )    //式179分子中的第一项
                lb2 = MAX( lb2, G_i );
            else    //式177
            {
                ++nr_free2;    //式177的分母,即计数
                sum_free2 += G_i;    //式177的分子,求和
            }
        }
    }
    //如果nr_free1大于0,说明在zi=1下有样本的βi的值在0和C之间,则利用式176计算r1;否则利用式178计算r1
    r1 = nr_free1 > 0 ? sum_free1/nr_free1 : (ub1 + lb1)*0.5;
    //如果nr_free2大于0,说明在zi=-1下有样本的βi的值在0和C之间,则利用式177计算r2;否则利用式179计算r2
    r2 = nr_free2 > 0 ? sum_free2/nr_free2 : (ub2 + lb2)*0.5;

    rho = (r1 - r2)*0.5;    //式180,得到-b
    r = (r1 + r2)*0.5;    //式180,得到ρ,该变量用于ν-SVC
}

优化那些使用线性核函数(式53)的SVM,目的是用一个支持向量来代表所有的支持向量:

void CvSVM::optimize_linear_svm()
{
    // we optimize only linear SVM: compress all the support vectors into one.
    if( params.kernel_type != LINEAR )    //判断是否为线性核函数
        return;
    //如果是SVC,则得到分类的数量;如果是单类SVM,则class_count为1;如果是SVR,则class_count为0
    int class_count = class_labels ? class_labels->cols :
            params.svm_type == CvSVM::ONE_CLASS ? 1 : 0;
    // df_count为决策函数的数量,在多个分类的SVC中,该值为class_count*(class_count-1)/2,其他情况该值为1
    int i, df_count = class_count > 1 ? class_count*(class_count-1)/2 : 1;
    CvSVMDecisionFunc* df = decision_func;    //赋值决策函数指针
    //遍历所有的决策函数,如果当前决策函数的支持向量的数量不为1,则退出该循环
    for( i = 0; i < df_count; i++ )
    {
        int sv_count = df[i].sv_count;
        if( sv_count != 1 )
            break;
    }

    // if every decision functions uses a single support vector;
    // it's already compressed. skip it then.
    //i为前面for循环中的循环次数索引,如果i等于df_count,说明所有的决策函数中的支持向量的数量都为1个,所以无需再优化处理,则退出该函数
    if( i == df_count )
        return;

    int var_count = get_var_count();    //得到特征属性的数量
    cv::AutoBuffer<double> vbuf(var_count);    //为vbuf分配内存
    double* v = vbuf;    //赋值
    //为new_sv变量分配内存,new_sv表示每个决策函数优化处理后的新的支持向量
    float** new_sv = (float**)cvMemStorageAlloc(storage, df_count*sizeof(new_sv[0]));
    //遍历所有的决策函数,优化处理每个决策函数
    for( i = 0; i < df_count; i++ )
    {
        //为第i个决策函数的新的支持向量new_sv[i]分配内存
        new_sv[i] = (float*)cvMemStorageAlloc(storage, var_count*sizeof(new_sv[i][0]));
        float* dst = new_sv[i];    //赋值
        memset(v, 0, var_count*sizeof(v[0]));    //清零
        int j, k, sv_count = df[i].sv_count;
        //遍历当前决策函数的所有支持向量
        for( j = 0; j < sv_count; j++ )
        {
            //得到当前支持向量所对应的样本
            const float* src = class_count > 1 && df[i].sv_index ? sv[df[i].sv_index[j]] : sv[j];
            double a = df[i].alpha[j];    //得到当前支持向量的αi
            //遍历该样本的所有特征属性,得到一个新的支持向量v=∑ixiαi
            for( k = 0; k < var_count; k++ )
                v[k] += src[k]*a;
        }
        for( k = 0; k < var_count; k++ )
            dst[k] = (float)v[k];    //赋值
        df[i].sv_count = 1;    //此时,只有一个支持向量v
        df[i].alpha[0] = 1.;    //根据约束条件,只有一个支持向量时,α=1
        if( class_count > 1 && df[i].sv_index )
            df[i].sv_index[0] = i;    //索引赋值
    }

    sv = new_sv;    //新的支持向量
    //支持向量的数量,它等于决策函数的数量,因为此时每个决策函数只有一个支持向量
    sv_total = df_count;
}

在前面应用get_row函数计算矩阵Q(即式148中的Q=zizjK(xi,xj))的第i列首地址时,涉及到计算核函数K(xi,xj),即调用calc函数。在用于SVM对样本进行预测时,需要计算决策函数,此时也需要计算核函数K(xi,xj)。但两者还是有区别的,在计算Q时,要用到所有的样本,而计算决策函数时,只需要用到支持向量即可,也就是说在计算Q时,用于表示支持向量的变量用全体样本来替代。

下面我们就来介绍calc函数:

void CvSVMKernel::calc( int vcount, int var_count, const float** vecs,
                        const float* another, Qfloat* results )
// vcount表示支持向量的数量
// var_count表示样本的特征属性的数量
// vecs表示具体的支持向量
// another表示核函数所需要的另一个样本数据,如果是预测,则为预测样本
//results表示最终的核函数结果
{
    const Qfloat max_val = (Qfloat)(FLT_MAX*1e-3);
    int j;
    //调用calc_func函数
    //在实例化CvSVMKernel时,会通过create函数为calc_func的函数指针赋值:当为线性核函数(式53)时,calc_func函数为calc_linear;当为多项式核函数(式54)时,calc_func函数为calc_poly;当为高斯核函数(式56)时,calc_func函数为calc_rbf;当为Sigmoid核函数(式57)时,calc_func函数为calc_sigmoid。这4个函数在后面都有介绍
    (this->*calc_func)( vcount, var_count, vecs, another, results );
    //遍历支持向量,确保核函数的向量中不能有太大的元素
    for( j = 0; j < vcount; j++ )
    {
        if( results[j] > max_val )
            results[j] = max_val;
    }
}

计算线性核函数:

void CvSVMKernel::calc_linear( int vcount, int var_count, const float** vecs,
                               const float* another, Qfloat* results )
{
    //调用calc_non_rbf_base函数,计算α xi·xj+β,对于线性核函数来说,α=1,β=0,该函数在后面会给出讲解
    calc_non_rbf_base( vcount, var_count, vecs, another, results, 1, 0 );
}

计算多项式核函数:

void CvSVMKernel::calc_poly( int vcount, int var_count, const float** vecs,
                             const float* another, Qfloat* results )
{
    CvMat R = cvMat( 1, vcount, QFLOAT_TYPE, results );
    //调用calc_non_rbf_base函数,计算α xi·xj+β,对于多项式核函数(式54)来说,α=γ,β=p,γ为params->gamma,p为params->coef0,该函数在后面会给出讲解
    calc_non_rbf_base( vcount, var_count, vecs, another, results, params->gamma, params->coef0 );
    //最终得到式54,式中的q为params->degree
    if( vcount > 0 )
        cvPow( &R, &R, params->degree );
}

计算Sigmoid核函数:

void CvSVMKernel::calc_sigmoid( int vcount, int var_count, const float** vecs,
                                const float* another, Qfloat* results )
{
    int j;
    //调用calc_non_rbf_base函数,计算-2(γ xi·xj+p),对于Sigmoid核函数(式57)来说,α=-2γ,β=-2p,γ为params->gamma,p为params->coef0,该函数在后面会给出讲解
    calc_non_rbf_base( vcount, var_count, vecs, another, results,
                       -2*params->gamma, -2*params->coef0 );
    // TODO: speedup this
    for( j = 0; j < vcount; j++ )    //计算式57
    {
        Qfloat t = results[j];    //得到e的指数部分,即-2(γ xi·xj+p)
        double e = exp(-fabs(t));    //得到e指数
        //得到双曲正切
        if( t > 0 )
            results[j] = (Qfloat)((1. - e)/(1. + e));
        else
            results[j] = (Qfloat)((e - 1.)/(e + 1.));
    }
}

计算高斯(径向基函数)核函数:

void CvSVMKernel::calc_rbf( int vcount, int var_count, const float** vecs,
                            const float* another, Qfloat* results )
{
    //定义一个矩阵,作为高斯核函数的结果输出
    CvMat R = cvMat( 1, vcount, QFLOAT_TYPE, results );
    double gamma = -params->gamma;    //得到式55中的参数-γ
    int j, k;
    //遍历所有支持向量
    for( j = 0; j < vcount; j++ )
    {
        const float* sample = vecs[j];    //得到当前支持向量,即样本数据
        double s = 0;
        //以4个为一个单位,遍历当前样本的特征属性,计算||xi-xj||
        for( k = 0; k <= var_count - 4; k += 4 )
        {
            double t0 = sample[k] - another[k];
            double t1 = sample[k+1] - another[k+1];

            s += t0*t0 + t1*t1;

            t0 = sample[k+2] - another[k+2];
            t1 = sample[k+3] - another[k+3];

            s += t0*t0 + t1*t1;
        }
        //计算不足4个的,也就是剩余的特征属性的||xi-xj||
        for( ; k < var_count; k++ )
        {
            double t0 = sample[k] - another[k];
            s += t0*t0;
        }
        results[j] = (Qfloat)(s*gamma);    //得到-γ||xi-xj||
    }

    if( vcount > 0 )
        cvExp( &R, &R );    //得到最终的结果,即式56
}

除了calc_rbf函数以外,calc_linear函数,calc_poly函数和calc_sigmoid函数都会调用calc_non_rbf_base函数,因为这3个核函数都需要计算xi·xj

void CvSVMKernel::calc_non_rbf_base( int vcount, int var_count, const float** vecs,
                                     const float* another, Qfloat* results,
                                     double alpha, double beta )
{
    int j, k;
    //遍历所有支持向量
    for( j = 0; j < vcount; j++ )
    {
        const float* sample = vecs[j];    //得到当前的支持向量,即样本数据
        double s = 0;
        //以4个为一个单位,遍历当前样本的特征属性,计算xi·xj
        for( k = 0; k <= var_count - 4; k += 4 )
            s += sample[k]*another[k] + sample[k+1]*another[k+1] +
                 sample[k+2]*another[k+2] + sample[k+3]*another[k+3];
        //计算不足4个的,也就是剩余的特征属性的xi·xj
        for( ; k < var_count; k++ )
            s += sample[k]*another[k];
        //最终得到α xi·xj+β
        results[j] = (Qfloat)(s*alpha + beta);
    }
}

下面介绍SVM预测样本函数predict。该函数有许多形式,如:

float CvSVM::predict(const Mat& sample,bool returnDFVal=false )

float CvSVM::predict(const CvMat* sample,bool returnDFVal=false )

float CvSVM::predict(const CvMat* samples,CvMat* results)

其中,sample表示需要预测的样本数据,returnDFVal定义该函数的返回类型,为true,并且是两类分类问题时,该函数返回决策函数中sgn函数内的具体值,否则该函数返回分类标签(SVC),或返回估计函数(SVR),results表示相对应样本的预测输出,如果只预测一个样本,则该函数返回预测结果,如果预测多个样本,则必须使用results参数来返回预测结果。

不管哪种形式的predict函数,最终都会调用下面这个函数:

float CvSVM::predict( const float* row_sample, int row_len, bool returnDFVal ) const
// row_sample表示待预测的一个样本
// row_len表示该样本的特征属性的数量
//函数返回为预测结果
{
    assert( kernel );    //确保SVM模型中核函数数据形式的正确
    assert( row_sample );    //确保预测样本数据形式的正确

    int var_count = get_var_count();    //得到SVM模型中样本的特征属性的数量
    //确保SVM模型的样本和预测样本的特征属性的数量相同
    assert( row_len == var_count );
    (void)row_len;
    //如果是SVC,class_count为分类的数量;如果是单类SVM,class_count为1;如果是SVR,class_count为0
    int class_count = class_labels ? class_labels->cols :
                  params.svm_type == ONE_CLASS ? 1 : 0;

    float result = 0;    //表示预测结果
    cv::AutoBuffer<float> _buffer(sv_total + (class_count+1)*2);    //分配一块内存空间
    float* buffer = _buffer;

    if( params.svm_type == EPS_SVR ||    //ε-SVR类型
        params.svm_type == NU_SVR ||    //ν-SVR类型
        params.svm_type == ONE_CLASS )    //单类SVM类型
    {
        CvSVMDecisionFunc* df = (CvSVMDecisionFunc*)decision_func;    //得到决策函数
        int i, sv_count = df->sv_count;    //sv_count表示支持向量的数量
        double sum = -df->rho;    //得到决策函数的参数b
        //计算核函数
        kernel->calc( sv_count, var_count, (const float**)sv, row_sample, buffer );
        //遍历所有的支持向量,由决策函数得到最终的预测结果
        for( i = 0; i < sv_count; i++ )
            sum += buffer[i]*df->alpha[i];
        //如果是单类SVM,则对sum取sgn,即式90
        result = params.svm_type == ONE_CLASS ? (float)(sum > 0) : (float)sum;
    }
    else if( params.svm_type == C_SVC ||    //C-SVC类型
             params.svm_type == NU_SVC )    //ν-SVC类型
    {
        CvSVMDecisionFunc* df = (CvSVMDecisionFunc*)decision_func;    //得到决策函数
        int* vote = (int*)(buffer + sv_total);    //表示记录投票结果
        int i, j, k;
        //为vote开辟内存并清零
        memset( vote, 0, class_count*sizeof(vote[0]));
        //计算核函数
        kernel->calc( sv_total, var_count, (const float**)sv, row_sample, buffer );
        double sum = 0.;

        for( i = 0; i < class_count; i++ )    //遍历所有分类类别
        {
            //对不重复的两个分类进行比较
            for( j = i+1; j < class_count; j++, df++ )
            {
                sum = -df->rho;    //得到决策函数的参数b
                int sv_count = df->sv_count;
                //遍历所有的支持向量,由决策函数得到最终的预测结果
                for( k = 0; k < sv_count; k++ )
                    sum += df->alpha[k]*buffer[df->sv_index[k]];

                vote[sum > 0 ? i : j]++;    //统计投票结果
            }
        }
        //遍历所有分类类别,得到票数最多的那个分类类别
        for( i = 1, k = 0; i < class_count; i++ )
        {
            if( vote[i] > vote[k] )
                k = i;    //k表示票数最多的那个分类类别
        }
        //如果returnDFVal为true,并且是2类的SVM,则result为决策函数中sgn函数内的值,否则result为预测的分类标签
        result = returnDFVal && class_count == 2 ? (float)sum : (float)(class_labels->data.i[k]);
    }
    else    //不是以上5种SVM类型,则提示错误信息
        CV_Error( CV_StsBadArg, "INTERNAL ERROR: Unknown SVM type, "
                                "the SVM structure is probably corrupted" );

    return result;    //返回预测结果
}

应用实例

下面我们给出一个具体的SVM应用实例。本次的实例来源于http://archive.ics.uci.edu/ml/中的risi数据,目的是用于判断样本是属于哪类植物:setosa,versicolor,virginica。每类植物各选择20个样本进行训练,而每个样本具有以下4个特征属性:花萼长,花萼宽,花瓣长,花瓣宽。

#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/ml/ml.hpp"

#include <iostream>
using namespace cv;
using namespace std;

int main( int argc, char** argv )
{
    //60个训练样本
    double trainingData[60][4]={{5.1,3.5,1.4,0.2}, {4.9,3.0,1.4,0.2}, {4.7,3.2,1.3,0.2},
                            {4.6,3.1,1.5,0.2}, {5.0,3.6,1.4,0.2}, {5.4,3.9,1.7,0.4},
                            {4.6,3.4,1.4,0.3}, {5.0,3.4,1.5,0.2}, {4.4,2.9,1.4,0.2},
                            {4.9,3.1,1.5,0.1}, {5.4,3.7,1.5,0.2}, {4.8,3.4,1.6,0.2},
                            {4.8,3.0,1.4,0.1}, {4.3,3.0,1.1,0.1}, {5.8,4.0,1.2,0.2},
                            {5.7,4.4,1.5,0.4}, {5.4,3.9,1.3,0.4}, {5.1,3.5,1.4,0.3},
                            {5.7,3.8,1.7,0.3}, {5.1,3.8,1.5,0.3},
                            {7.0,3.2,4.7,1.4}, {6.4,3.2,4.5,1.5}, {6.9,3.1,4.9,1.5},
                            {5.5,2.3,4.0,1.3}, {6.5,2.8,4.6,1.5}, {5.7,2.8,4.5,1.3},
                            {6.3,3.3,4.7,1.6}, {4.9,2.4,3.3,1.0}, {6.6,2.9,4.6,1.3},
                            {5.2,2.7,3.9,1.4}, {5.0,2.0,3.5,1.0}, {5.9,3.0,4.2,1.5},
                            {6.0,2.2,4.0,1.0}, {6.1,2.9,4.7,1.4}, {5.6,2.9,3.6,1.3},
                            {6.7,3.1,4.4,1.4}, {5.6,3.0,4.5,1.5}, {5.8,2.7,4.1,1.0},
                            {6.2,2.2,4.5,1.5}, {5.6,2.5,3.9,1.1},
                            {6.3,3.3,6.0,2.5}, {5.8,2.7,5.1,1.9}, {7.1,3.0,5.9,2.1},
                            {6.3,2.9,5.6,1.8}, {6.5,3.0,5.8,2.2}, {7.6,3.0,6.6,2.1},
                            {4.9,2.5,4.5,1.7}, {7.3,2.9,6.3,1.8}, {6.7,2.5,5.8,1.8},
                            {7.2,3.6,6.1,2.5}, {6.5,3.2,5.1,2.0}, {6.4,2.7,5.3,1.9},
                            {6.8,3.0,5.5,2.1}, {5.7,2.5,5.0,2.0}, {5.8,2.8,5.1,2.4},
                            {6.4,3.2,5.3,2.3}, {6.5,3.0,5.5,1.8}, {7.7,3.8,6.7,2.2},
                            {7.7,2.6,6.9,2.3}, {6.0,2.2,5.0,1.5}	};
    Mat trainingDataMat(60, 4, CV_32FC1, trainingData);
    //训练样本所对应的类别,S表示setosa,V表示versicolor,R表示virginica
    float responses[60] = {'S','S','S','S','S','S','S','S','S','S','S','S','S','S','S','S','S','S','S','S',
                      'V','V','V','V','V','V','V','V','V','V','V','V','V','V','V','V','V','V','V','V',
                      'R','R','R','R','R','R','R','R','R','R','R','R','R','R','R','R','R','R','R','R'};
    Mat responsesMat(60, 1, CV_32FC1, responses);

    //设置SVM参数
    CvSVMParams params;
    params.svm_type = CvSVM::C_SVC;    //SVM类型为C-SVC
    params.C = 10.0;    //C参数设置为10
    params.kernel_type = CvSVM::RBF;    //核函数为高斯核函数
    params.gamma = 8.0;    //高斯核函数中的γ参数设置为8
    //迭代的终止条件
    params.term_crit = cvTermCriteria(CV_TERMCRIT_EPS, 1000, FLT_EPSILON);

    //建立SVM模型
    CvSVM svm;
    svm.train(trainingDataMat, responsesMat, Mat(), Mat(), params);
    //预测样本数据
    double sampleData[4]={ 6.7, 3.1, 4.7, 1.5};
    Mat sampleMat(4, 1, CV_32FC1, sampleData);
    float r = svm.predict(sampleMat);    //预测结果
    cout<<endl<<"result:  "<<(char)r<<endl;    //输出结果

    return 0;
}

输出结果为:

result:  V

时间: 2024-10-26 01:24:39

OpenCV2.4.9源码分析——Support Vector Machines的相关文章

stl源码分析之vector

上篇简单介绍了gcc4.8提供的几种allocator的实现方法和作用,这是所有stl组件的基础,容器必须通过allocator申请分配内存和释放内存,至于底层是直接分配释放内存还是使用内存池等方法就不是组件需要考虑的事情.这篇文章开始分析gcc4.8 stl的容器源码实现.stl的容器分为序列式容器和关联式容器,前者包括vector,list,queue以及stack等常用数据结构,后者包含了map,set以及hash table等比较高级的结构,本文就从使用最广泛也是最基础的vector开始

Opencv2.4.9源码分析——Cascade Classification(三)

前两篇文章分别介绍了级联分类器的原理和源码解析,下面我们给出一个具体的应用实例. 下面我们以车牌识别为例,具体讲解OpenCV的级联分类器的用法.在这里我们只对蓝底白字的普通车牌进行识别判断,对于其他车牌不在考虑范围内.而且车牌是正面照,略微倾斜可以,倾斜程度太大也是不在识别范围内的. 我们通过不同渠道共收集了1545幅符合要求的带有车牌图像的照片(很遗憾,我只能得到这么多车牌照片,如果能再多一些就更好了!),通过ACDSee软件手工把车牌图像从照片中剪切出来,并统一保存为jpg格式.为便于后续

Opencv2.4.9源码分析——Gradient Boosted Trees

一.原理 梯度提升树(GBT,Gradient Boosted Trees,或称为梯度提升决策树)算法是由Friedman于1999年首次完整的提出,该算法可以实现回归.分类和排序.GBT的优点是特征属性无需进行归一化处理,预测速度快,可以应用不同的损失函数等. 从它的名字就可以看出,GBT包括三个机器学习的优化算法:决策树方法.提升方法和梯度下降法.前两种算法在我以前的文章中都有详细的介绍,在这里我只做简单描述. 决策树是一个由根节点.中间节点.叶节点和分支构成的树状模型,分支代表着数据的走向

Opencv2.4.9源码分析——Random Trees

一.原理 随机森林(Random Forest)的思想最早是由Ho于1995年首次提出,后来Breiman完整系统的发展了该算法,并命名为随机森林,而且他和他的博士学生兼同事Cutler把Random Forest注册成了商标,这可能也是Opencv把该算法命名为Random Trees的原因吧. 一片森林是由许多棵树木组成,森林中的每棵树可以说是彼此不相关,也就是说每棵树木的生长完全是由自身条件决定的,只有保持森林的多样性,森林才能更好的生长下去.随机森林算法与真实的森林相类似,它是由许多决策

Win7下qt5.3.1+opencv2.4.9编译环境的搭建(好多 Opencv2.4.9源码分析的博客)

到官网下载qt-opensource-windows-x86-mingw482_opengl-5.3.1.exe文件,执行该文件,选择默认安装即可实现QT的安装(安装在C盘的根目录下),该文件封装好了Qt libraries.Qt Creator,其中Qt Creator为3.1.2版本. 到官网http://opencv.org/downloads.html下载OpenCV for Windows2.4.9版本——opencv-2.4.9.exe.执行该文件,把它解压到适当的目录下即可,我是把

STL源码分析 # vector #

下面是一个使用vector的demo: #include <iostream> #include <vector> using namespace std; int main() { /* ** To create a vector which contain 10 elements and the value ** of each element is 1 */ vector<int> vec(10, 1); vector<int>::iterator i

Java集合源码分析之Vector

1. Vector简介 public class Vector<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable Vector实现了可扩展的对象数组List Vector实现了RandomAcess接口,支持索引,支持根据索引快速查找元素.RandomAccess Vector实现了Cloneable接口,可以被克隆Cloneable

Stack和Vector源码分析

Stack和Vector源码分析 Stack和Vector源码分析stack源码分析1.Stack是什么2.Stack的结构图3.Stack继承关系4.Stack的主要方法5.Stack源码Vector源码分析1.vector介绍2.vector的关系图3.vector和ArrayList的关系4.Vector的大致图像5.Vector的源码 stack源码分析 1.Stack是什么 Stack是栈.它的特性是:先进后出(FILO, First In Last Out). java工具包中的St

《Java源码分析》:Vector

<Java源码分析>:Vector 虽然,Vector集合在我们的编程中,使用的比较少,至少我使用的比较少,一般情况下,我都是倾向于使用List来存储一些同类型的元素. 其实,Vector的内部实现和ArrayList的内部实现基本一致,内部都是借助于数组来实现的.下面就一起来分析下. HashMap类的源码分析,博客在这里:http://blog.csdn.net/u010412719/article/details/51980632 Hashtable类的源码分析,博客在这里:http:/