机器学习之ROC曲线
roc曲线全称受试者工作曲线,ROC曲线下面积就是AUC(Area under the curve),AUC用来衡量二分类机器学习算法的性能,即泛化能力
这里有几个概念,真阳性率,假阳性率,真阴性率,假阴性率,这四个率的产生是一个相对指标,即有一个参考标准,比如一个检测方法的金标准,
我用另一种方法检测,如下图所示
真(预测值) | 假(预测值) | |
---|---|---|
真(金标准) | 20 | 5 |
假(金标准) | 3 | 15 |
这个表里面我们分别来计算真阳性率和假阳性率(注意:所谓的真阳性率和假阳性率都是依据金标准来评判的)
比如真阳性率=实际预测并且正确的阳性数/真正的阳性数
=TP/(TP+FN)
=20/(20+5)
假阳性率=实际为假但是被预测为真/(实际为假但是被预测为真+真正为假并且预测为假的数)
=FP/(FP+TN)
=3/(3+15)
其中,真阳性率又叫做敏感度,真阴性率又叫特异性
所以有时候假阳性率也可以=1-真阴性率=1-特异度
总之,这里面的一切真阳性假阳性真阴性假阴性都是依据金标准来的
根据不同标准来得到不同的真阳性率,假阳性率的值,然后以假阳性率和真阳性率为横纵坐标做点,连接成折线图,就是ROC曲线
原文地址:https://www.cnblogs.com/missed-forest/p/9795221.html
时间: 2024-10-08 12:31:43