从TP、FP、TN、FN到ROC曲线、miss rate、行人检测评估

想要在行人检测的evaluation阶段要计算miss rate，就要从True Positive Rate讲起：miss rate = 1 - true positive rate

true positive rate毕竟是一个rate，是一个比值。是谁和谁比呢？P

要从TP、FP、TN、FN讲起。
考虑一个二分类问题：一个item，它实际值有0、1两种取值，即负例、正例；而二分类算法预测出来的结果，也只有0、1两种取值，即负例、正例。我们不考虑二分类算法细节，当作黑箱子就好；我们关心的是，预测的结果和实际情况匹配、偏差的情况。

TP：true positive，实际是正例，预测为正例
FP：false positive，实际为负例，预测为正例
TN：true negative，实际为负例，预测为负例
FN：false negative，实际为正例，预测为负例

也就是说：我们不仅考虑算法的预测结果对不对，还要考虑是“哪一种对”；我们还考虑算法预测错的情况，并且我们深究“是哪一种错”：

OK，既然把TP、FP、TN、FN搞清楚了，那么看几个rate的定义。
TPR:true positive rate, 等于,又叫precision rate
FPR:false positive rate,等于
TNR:true negative rate,等于
FNR:false negative rate,等于，又叫miss rate
观察后不难发现，每个rate的公式，都是前，#表示number，即统计数量。
而结合前面画的那张图，容易发现，每个rate公式还可以通过画图理解：每个rate都等于，虽然这么说起来不严谨，赫赫但是形象化的理解更容易记住。
还有一点：fnr+tpr=1, fpr+tnr=1
其实后面使用到的，更多的是fnr，俗称miss rate，作为ROC曲线的纵坐标；而横坐标则取fpr

理解阈值
再次考虑二分类问题。你说，真实世界会存在严格的二分类吗？就说人的性取向，有的人也是“徘徊不定”的，这样的人真是让人头疼但是必须想办法处理掉。因此设定一个阈值：根据这个人的一系列举动，给ta的性别累计打分并最终映射到[0,1]区间(得到score)，然后比如设定阈值t为0.5，若score>t=0.5，那么ta是男的；否则是女的。
回到理论上，每一个需要预测的变量，其取值都可以根据阈值进行划分。对于二分类，我设定阈值t,当某个item取值大于t，就判定为正例(positive),否则判定为负例(negative)。
也就是说，我手头有一堆预测得到的数据（甭管我用的是哪种机器学习算法），我通过设定不同的阈值，能得到不同的TP、FP、TN、FN取值，相应的TPR、FPR、TNR、FNR取值也产生变化。那么这种变化我就可以通过图像显示出来：对于一个确定的阈值t，FPR和TPR是确定的，得到一个(fpr,tpr)元组；将阈值从0到1变化，当t=0时所有预测结果都大于0都是Positive所以FP=TP=1,FN=TN=0,fpr=tpr=1,得到(1,1)点，当t=1时所有预测结果都小于0都是Negative所以FP=TP=0,FN=TN=1,fpr=tpr=0,得到(0,0)点，t取(0,1)上的值时则fpr和tpr都在0到1之间变化，且不难发现：当t增加，#FP也减小，#TN增加，则fpr减小；当t增加，#TP减小，#FN增加，则tpr减小。也就是说，当阈值t从0变化到1，fpr和tpr也单调减小，从(1，1)减小到(0,0)

呃，这里不知道为什么，大多数我看到的文献，都是画出fpr和tpr的图像，而把阈值本身省掉了，得到ROC曲线：

Anyway，我们继续，我们的目标是搞清楚行人检测评估中的miss rate怎么算。等等，好像已经出来了：miss rate = 1 - true positive rate，那么对应的YoX图像，也就是miss rate - false positive rate图像，就应当是单调下降的曲线。

绘图
干巴巴的说什么单调增加单调下降缺少直观印象，有代码有绘图才是正道~
我使用的是Caltech行人检测数据集网站主页提供的matlab工具，因为想要搞明白的miss rate是在pedestrian检测中作为评价标准出现，而这个Caltech数据集以及matlab工具都是行人检测中会用到的工具。废话不多说，下载好这个toolbox后打开并添加到path中，进入matlab目录调用plotRoc函数就能玩了，比如：

1.k=2; x=0:.0001:1; data1 = [1-x; (1-x.^k).^(1/k)]‘;2.k=3; x=0:.0001:1; data2 = [1-x; (1-x.^k).^(1/k)]‘;3.hs(1)=plotRoc(data1,struct(‘color‘,‘g‘,‘marker‘,‘s‘));4.hs(2)=plotRoc(data2,struct(‘color‘,‘b‘,‘lineSt‘,‘--‘));5.legend( hs, {‘roc1‘,‘roc2‘} ); xlabel(‘fp‘); ylabel(‘fn‘);

图中纵坐标标记为fn，其实是fnr(false negative rate)，也就是1-tnr。fnr俗称miss rate。而横坐标fpr（false positive rate)，也可以用FPPI(False Positive Per Image)或者FPPW(False Positive Per Window)来表示。

OK，总算搞懂了：要想绘制行人检测的evaluation阶段的miss rate - FPPI图像（roc曲线），需要有带annotation的测试图片（提供作为ground truth的object window的bbox坐标），并且用某个算法（各种机器学习模型都行，看效果了）对每个测试图片算出若干bbox坐标：前者()作为“实际取值”，后者()作为“预测取值”，当阈值t从0变化到1，每个预测取值也会变化，从{TP,FP,TN,FN}中取值，而在任意一个t的取值上，FPR、FNR（miss rate）都可以通过统计#TP,#FP,#TN,#FN后算出，因而就能得到plotRoc绘图函数所需的参数D，进而绘制出ROC曲线勒~

时间： 2024-10-13 07:24:58

从TP、FP、TN、FN到ROC曲线、miss rate、行人检测评估

从TP、FP、TN、FN到ROC曲线、miss rate、行人检测评估的相关文章

精确率与召回率，RoC曲线与PR曲线

ROC曲线 VS PR曲线

R语言中绘制ROC曲线和PR曲线

ROC曲线

【数据挖掘】朴素贝叶斯算法计算ROC曲线的面积

【ROC曲线】关于ROC曲线、PR曲线对于不平衡样本的不敏感性分析说引发的思考

ROC曲线与AUC值

Precision/Recall和ROC曲线与分类

机器学习之分类器性能指标之ROC曲线、AUC值