本质是ROC曲线下的面积,ROC曲线x轴是误判率(false positive rate),y轴是准确率(true positive rate)。
AUC计算:
1. 使用Wilcoxon-Mann-Witney Test
AUC和Wilcoxon-Mann-Witney Test有等价的性质。Wilcoxon-Mann-Witney Test是测试任意给一个正样本和一个负样本,正样本score大于负样本score的概率。
算法:
统计所有的 M×N(M为正样本数,N为负样本数)个正负样本对中,有多少组中的正样本score大于负样本score。当二元组中正负样本的score相等的时候,按照0.5计算。然后除以MN。实现这个方法的复杂度为O(n^2)。n为样本数(即n=M+N)
2. 方法1的简化(降低计算时间复杂度)
算法:
首先对样本按score从大到小排序,然后令最大score对应样本的rank为n,第二大score对应样本的rank为n-1,以此类推。然后把所有的正样本的rank相加,再减去M-1个正样本两两组合的情况。然后再除以M×N。即
参考:
https://blog.csdn.net/pzy20062141/article/details/48711355
原文地址:https://www.cnblogs.com/yaoyaohust/p/11051807.html
时间: 2024-10-31 17:17:50