分类器的训练以分为以下三部进行:
1、 样本的创建
2、 训练分类器
3、 利用训练好的分类器进行目标检测。
对检测物体要确定其属性:是否为绝对刚性的物体,也就是检测的目标是一个固定物体,没有变化(如特定公司的商标),这样的物体只要提供一份样本就可以进行训练。
但绝大数时候我们想进行训练的目标是非绝对刚性的物体,如对人的检测,包括人脸识别、手势识别。
样本:分为正样本---------负样本
正样本处理步骤:
所谓所谓正样本就是只包含检测目标的图片(最好背景一致),对于这我个人认为最好是检测目标的最小外接矩,这样可以减少训练的计算量,减少目标检测的干扰,提高检测质量。
1、获取正样本,可以自己动手,也可以通过网络上的图像数据库,像人脸数据库就已经很全了,不必再自己制作。
2、图片处理
1)将正样本图片进行截取(自己收集的图片,主要是去掉训练时的不必要干扰)-----最小外接矩,
2)将处理后的图片进行归一化,将所有图像调整成一致大小,我用的“美图看看”这款软件,批量处理的,注意无论原图多大最好都处理成25*25以下的图像,这样计算机 训练速度快,而且不容易出现内存不够用。
3 将归一化后的图像进行灰度处理,这里我用的是一段opencv代码,http://www.cnblogs.com/linmengran/p/6513094.html
这样正样本就处理好了,接下来要生成pos.txt文件
cmd运行控制台,切换到存放样本图片的文件目录下:输入如下命令
运行结果:
在图像文件中多了个pos.txt文件,内容如下:
在对文件进行处理,使其含有图片信息:通过程序读取存入
格式为:图片路径 检测目标在图片中的个数 起始监测点坐标(x,y) 图片大小(w,h)
4、训练.vec文件
doc下运行一下命令(假设当前路径就是pos.txt所在的路径):opencv_createsamples.exe -vec pos.vec -info pos.txt -num 100 -w 30 -h 30
得到pos.vec文件。
负样本:不包含检测目标的任何图片。
1.不要求样本尺寸,但要大于等于正样本的大小;且负样本不能重复,要增大负样本的差异性。
2.负样本灰度化,同正样本操作相同。
3.运行命令:
最后将pos.vec和neg.txt文件拷贝到同一文件夹下。
这样正负样本就处理完了,训练见:
http://www.cnblogs.com/linmengran/p/6513017.html(老训练器)
。