cvCreateMTStumpClassifier计算最优弱分类器的代码总体思路

在我转载的其他的两篇文章里，有对cvCreateMTStumpClassifier的详细介绍，分别是http://blog.csdn.net/ding977921830/article/details/46356789和http://blog.csdn.net/ding977921830/article/details/46412465，但是我还是看了好多遍才梳理出一个头绪，现总结如下：

（1）预计算出所有特征对训练样本特征存储在valCache中，经过排序后，存储在idxCache；

（2）对特征分组，每组数量为portion；

（3）对于每个特征，也就是上面idxCache的每一行，利用宏ICV_DEF_FIND_STUMP_THRESHOLD( suffix, type, error ) 计算最佳阈值，衡量标准是不纯度（entropy，gini，misclasification，残差平方和）。

（4）最后的一个do-while循环，就是用来跳过和当前结点相同的特征值。虽然以后续的、相同的值作为结点划分左右子树，残差平方和可能会改变，但是决策树划分的最小单位是特征值的种类，因为在利用决策树进行分类的时候，必须对相同的特征值做出一样的决策（该划入左子树还是该划入右子树）。

时间： 2024-10-25 04:07:37

cvCreateMTStumpClassifier计算最优弱分类器的代码总体思路的相关文章

Opencv研读笔记:haartraining程序之cvCreateCARTClassifier函数详解（CART树状弱分类器创建）~

cvCreateCARTClassifier函数在haartraining程序中用于创建CART树状弱分类器,但一般只采用单一节点的CART分类器,即桩分类器,一个多节点的CART分类器训练耗时很多.根据自己的测试,要等差不多10分钟(2000正样本.2000负样本)才能训练完一个3节点的弱分类器,当然,总体的树状弱分类器的数目可能也会减少1/2.之所以将此函数拿出来说说,主要是因为在网上找不到针对这个函数的详细说明,同时,CART的应用十分广泛,自己也趁这个机会好好学学,把自己的一点理解分享给

用cart（分类回归树）作为弱分类器实现adaboost

在之前的决策树到集成学习里我们说了决策树和集成学习的基本概念(用了adaboost昨晚集成学习的例子),其后我们分别学习了决策树分类原理和adaboost原理和实现, 上两篇我们学习了cart(决策分类树),决策分类树也是决策树的一种,也是很强大的分类器,但是cart的深度太深,我们可以指定cart的深度使得cart变成强一点的弱分类器. 在决策树到集成学习我们提到,单棵复杂的决策树可以达到100%,而简单的集成学习只能有85%的正确率,下面我们尝试用强一点的弱分类器来看下集成学习的效果有没有提

最优间隔分类器

最优间隔分类器最优间隔分类器对于一个给定的数据集,目前有一个很现实的需求就是要找到一个合适的决策边界,使得样本中的最小间隔(几何间隔)最大,而且这样的分类器能够使得分割的训练样本集之间的间隔(gap)最大.现在,我们假设训练集合线性可分,即可以找一条超平面把正样本和负样本分割开来.那么我们如何找到一个超平面来最大化几何间隔呢?我们得到了如下的优化问题: maxγ,w,b γ s.t. y(i)(wTx(i)+ b) ≥ γ, i = 1, . . . , m ||w|| = 1 也就是说,我

（笔记）斯坦福机器学习第七讲--最优间隔分类器

本讲内容 1.Optional margin classifier(最优间隔分类器) 2.primal/dual optimization(原始优化问题和对偶优化问题)KKT conditions(KKT条件) 3.SVM dual (SVM的对偶问题) 4.kernels (核方法) 1.最优间隔分类器对于一个线性可分的训练集合,最优间隔分类器的任务是寻找到一个超平面(w,b), 使得该超平面到训练样本的几何间隔最大. 你可以任意地成比例地缩放w和b的值,这并不会改变几何间隔的大小. 例如,

机器学习-斯坦福：学习笔记7-最优间隔分类器问题

最优间隔分类器问题本次课程大纲: 1. 最优间隔分类器 2. 原始优化问题&对偶优化问题(KKT条件) 3. SVM对偶问题 4. 核方法(下一讲) 复习: 支撑向量机中改动的符号: 输出y∈{-1,+1} h输出的假设值也改为{-1,+1} g(z) = { 1 , 如果z>=0; -1, 如果z<0} hw.b(x)=g(wTx+b),这里的b相当于原来的θ0,w相当于原来θ除去θ0剩余部分,长度为n维.将截距b单提出来,方便引出支撑向量机. 函数间隔: 一个超平面(w,b)和

计算DXFReader中多边形的面积代码示例

在DXFReader中, 一般的多边形的面积计算绝对值其中K表是顶点的数目,它们的坐标,用于在求和和, 所以用下面的代码就可以计算出一个封闭的多段线的区域: view source print? 01 Dim Vertex As Object 02 Dim Entity As Object 03 Dim k As Long 04 Dim i As Long 05 Dim Area As Single 06 07 With DXFReader1 08 09 For Each Entity In

计算两点之间的角度的代码

+ ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 /// 离心率 /// 返回两点间的角度 private double PointToAngle(Point AOrigin, Point APoint, double AEccentricity) { if (APoint.X == AOrigin.X) if (APoint.Y > AOrigin.Y) return Math.PI * 0.5;

开源一个Mac漂亮的小工具 PPRows for Mac, 在Mac上优雅的计算你写了多少行代码

开源一个Mac漂亮的小工具 PPRows for Mac, 在Mac上优雅的计算你写了多少行代码. 开源地址: https://github.com/jkpang/PPRows

优酷电视剧爬虫代码实现一：下载解析视频网站页面(3)补充知识点：XPath无效怎么办？

XPath无效怎么办?明明XPath是通过定位子节点,copy xpath得到的,理论上是正确的 XPath无效怎么办?明明XPath是通过按F12定位符再copy XPath得到的,可是放在代码里就是不对呢? 前提:优酷电视剧爬虫代码实现一:下载解析视频网站页面(2)工作量已经完成.基于这个基础,进一步完善代码 1.新建页面解析接口. package com.dajiangtai.djt_spider.service; import com.dajiangtai.djt_spider.enti

猜你喜欢

第30讲：模式匹配高级实战：嵌套的Case class

如果一个case class 其构造函数的参数又是另一个case class,那么我们如果使用模式匹配呢? 请看下面的例子 package com.dt.scala.pattern_match abs ...

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2}

String.Format数字格式化输出 {0:N2} {0:D2} {0:C2} 数字 {0:N2} 12.36 数字 {0:N0} 13 货币 {0:c2} $12.36 货币 {0:c4} $1 ...

BZOJ1046 上升序列

题解: 神TM的字典序最小......这题的字典序最小是位置的字典序最小...仔细读读题目所以.我们求出以每个点为起点的最长递增子序列..然后输出的话.贪心就行如何求每个点为起点的最长递增子序列 ...

聊聊创新思维

可以这么说, 诺贝尔奖项是对与创新思维最高的赞赏. 自然科学领域的创新,是对于自己领域的补充和改进.而工程领域的创新,则是对于旧事物的彻底毁灭,生成全新的事物. 在自然科学领域,爱因斯坦提出了相对论, ...

WPF+通过配置文件生成菜单（Menu）+源码

这个月做项目,遇到过一个通过配置文件来生成菜单的解决方案,感觉挺优雅的,特地放到博客园来,以飨读者. 说来惭愧,以前做的项目都没有这样用过,都是固定死了.如果后续有需要加入菜单,还得在重新修改UI,然 ...

谢霆锋为电影《一生一世》创作主题曲

谢霆锋为电影<一生一世>创作主题曲谢霆锋为电影<一生一世>创作主题曲谢霆锋为电影<一生一世>创作主题曲谢霆锋为电影<一生一世>创作主题曲谢霆锋为电影&l ...

c语言中二维数组作函数参数以及二维数组的理解

当二维数组作函数参数接受主调函数中的二维数组时,退化为一个指向数组的指针. 在此引用<c与指针>中的观点:作为函数参数的多位数组名的穿递方式和一维数组名相同--实际传递的是个指向数组第一 ...

Python语言及应用--阅读笔记

大括号的英文是curly bracket JSON(JavaScript Object Notation,JavaScript 对象符号) 变量名只能包含以下字符:? 小写字母(a~z)? 大写字母( ...

centos7常见问题-firewalld和iptables

防火墙 Iptables CentOS7.0默认使用的是firewall作为防火墙,我们先用之前的iptables. systemctl stop firewalld systemctl disabl ...

杭电1171 Big Event in HDU（母函数+多重背包解法）

Big Event in HDU Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others ...

Linux文本编辑器VIM

Vim简介 Vim是一个功能强大的全屏文本编辑器,是Linux/UNIX上最常见的文本编辑器,它的作用是建立.编辑.显示文本文件. Vim 没有菜单,只有命令 Vim的三种模式:命令模式,插入模式,编 ...

关于html页面中<a>标签的一点小问题

今天无聊在电脑上写一个网页的音乐播放器,在点击播放列表中的歌名时,页面突然就调到顶部了.我的a标签是这样写的:<a href="#"></a>.按理说是不该 ...

File.basename函数返回filename中的最后一条斜线后面的部分.若给出了参数suffix且它和filename的尾部一致时,该方法会将其删除并返回结果. 例: p File.basen ...

VPN 工作原理

VPN 工作原理引言在过去几十年中,世界发生了很大的变化.现在很多公司除了处理本地或地区性事务外,还要考虑全球市场和物流的问题.很多公司在全国甚至全球都设有分支机构,而这些公司都需要做的一件事情就 ...

数组值去重-小技巧

把值存为数组的键,利用键的特性来进行对值的去重,然后再用array_keys获取键值保存为新的数组即可达到去重的效果 $tmp_arr = array(); foreach ($key as $val ...

HTTP协议--简析

HTTP--超文本传输协议(HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议,是所有的www文件都必须遵守的标准. 要想成为优秀的web开发人员,必须熟悉H ...

Java中读取文件

Java中读取文件,去除一些分隔符,保存在多维数组里面 1 public void readFile(String filePath) 2 { 3 File file=new File(filePat ...

相对路径表示..\注意细节

1.表示相对路径用..\表示当前路径的上一级目录: 2.表示相对路径用..\..\表示当前路径的上两级目录: 3.当..\..\a.txt表示当前路径的上两级目录的根目录下面有个文件a.txt: 4. ...

SQL Server 索引和表体系结构（非聚集索引）

原文:SQL Server 索引和表体系结构(非聚集索引) 非聚集索引概述对于非聚集索引,涉及的信息要比聚集索引更多一些,由于整个篇幅比较大涉及接下来的要写的“包含列的索引”,“索引碎片”等一些知 ...

掌握解决问题的艺术，学会迭代开发，成为协作开发的专家，然后为写出更好的代码而担忧(转)

很多开发人员普遍犯有一个错误,认为他们的工作就是写代码.这不是一个开发人员要做的事情. 一个开发人员的工作是解决问题. 解决问题的一部分过程通常涉及到写代码,但是这部分工作是非常非常小的.开发有用的东 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.