AUC计算方法

本质是ROC曲线下的面积，ROC曲线x轴是误判率(false positive rate)，y轴是准确率(true positive rate)。

AUC计算：

1. 使用Wilcoxon-Mann-Witney Test

AUC和Wilcoxon-Mann-Witney Test有等价的性质。Wilcoxon-Mann-Witney Test是测试任意给一个正样本和一个负样本，正样本score大于负样本score的概率。

算法：

统计所有的 M×N(M为正样本数，N为负样本数)个正负样本对中，有多少组中的正样本score大于负样本score。当二元组中正负样本的score相等的时候，按照0.5计算。然后除以MN。实现这个方法的复杂度为O(n^2)。n为样本数（即n=M+N）

2. 方法1的简化（降低计算时间复杂度）

算法：

首先对样本按score从大到小排序，然后令最大score对应样本的rank为n，第二大score对应样本的rank为n-1，以此类推。然后把所有的正样本的rank相加，再减去M-1个正样本两两组合的情况。然后再除以M×N。即

参考：

https://blog.csdn.net/pzy20062141/article/details/48711355

原文地址：https://www.cnblogs.com/yaoyaohust/p/11051807.html

时间： 2024-10-31 17:17:50

AUC计算方法的相关文章

AUC计算方法总结

一.roc曲线 1.roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性. 横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例:(1-Specificity) 纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率) 2针对一个二分类问题,将实例分成正类(postive)或者负类(negative).但是实

【转】AUC(Area Under roc Curve )计算及其与ROC的关系

让我们从头说起,首先AUC是一种用来度量分类模型好坏的一个标准.这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度:在信息检索(IR)领域中常用的recall和precision,等等.其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识,而不同时期流行的度量则反映了人们认识事物的深度的变化.近年来,随着machine learning的相关技术从实验室走向实际应用,一些实际的

点击率模型AUC

一背景首先举个例子: 正样本(90) 负样本(10) 模型1预测正(90) 正(10) 模型2预测正(70)负(20) 正(5)负(5) 结论: 模型1准确率90%: 模型2 准确率75% 考虑对正负样本对预测能力,显然模型2要比模型1好,但对于这种正负样本分布不平衡对数据,准确率不能衡量分类器对好坏了,所以需要指标auc解决

机器学习：基于sklearn的AUC的计算原理

AUC原理一.AUC起源 AUC是一种用来度量分类模型好坏的一个标准.这样的标准其实有很多,例如:大约10年前在 machine learning文献中一统天下的标准:分类精度:在信息检索(IR)领域中常用的recall和precision,等等.其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识,而不同时期流行的度量则反映了人们认识事物的深度的变化.近年来,随着machine learning的相关技术从实验室走向实际应用,

模型评估-2

一.分类算法的评估 1.二分类 ROC与AUC 1.1 roc曲线:接收者操作特征(receiveroperating characteristic) roc曲线上每个点反映着对同一信号刺激的感受性.横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例:(1-Specificity):纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率). 2针对一个二分类问题,将实例分成正类(postive)

AUC的计算

AUC指的是Area under roc curve,是roc下的面积 roc指的receiver operating characteristic curve,接受者操作曲线,具体的指的什么呢,是一个二维的曲线,横坐标是假正率,计算公式为:预测为正的负样本/负样本数量.纵坐标是真正率,计算公式为:预测为正的正样本/正样本的数量. 很多地方都有介绍,我们这里直接说下AUC的计算方法吧 1. 直接计算曲线下的面积,这个不介绍了,一般不会使用 2. 正样本M个,负样本N个,做交叉,总共会产生M*N个

AUC(Area Under roc Curve)学习笔记

AUC是一种用来度量分类模型好坏的一个标准. ROC分析是从医疗分析领域引入了一种新的分类模型performance评判方法. ROC的全名叫做Receiver Operating Characteristic,其主要分析工具是一个画在二维平面上的曲线——ROC curve.平面的横坐标是false positive rate(FPR),纵坐标是true positive rate(TPR).对某个分类器而言,我们可以根据其在测试样本上的表现得到一个TPR和FPR点对.这样,此分类器就可以映射成

理解AUC

理解auc 1 ROC曲线和auc 从二分类说起,假设我们的样本全集里,所有样本的真实标签(label)为0或1,其中1表示正样本,0表示负样本,如果我们有一个分类模型,利用它对样本进行了标注,那边我们可以得到下面的划分 truth 1 0 predictor 1 TP FP 0 FN TN TP(true positive):表示正确的肯定 TN( true negative):表示正确的否定 FP(false positive):表示错误的肯定 FN (false negative):表示错

ROC与AUC曲线绘制

由于ROC曲线面积比较难求得,所以判断模型好坏一般使用AUC曲线关于AUC曲线的绘制,西瓜书上写得比较学术,不太能理解,假设有这么一个样本集: 假设预测样本为20个,预测为正类的概率已经进行了排序,得分递减,画图步骤为: (1) 在所排序的样本最左边,画一条线即无 | 1 2 3 4 5 …,线左边的认为是正类,右边认为是负类,可以算出,TP(实际为正,预测为正)=0,FN(实际为正,预测为负)=10,TN(实际为负,预测为负)=10,FP(实际为负,预测为正)=0,故而TPR=0,FPR

猜你喜欢

redis 学习三乐观锁

<?php header('content-type:text/html;chaeset=utf-8'); /** * redis实战 * * 实现乐观锁机制 * * @example php ...

黄聪：wordpress如何扩展TinyMCE编辑器，添加自定义按钮及功能

在functions.php文件里面添加: add_action( 'admin_init', 'my_tinymce_button' ); function my_tinymce_button() ...

Python批量下载百度贴吧贴子图片

批量下载贴吧里面某个贴子的所有图片,或者只下载某一页中的图片. #!/usr/bin/env python3 import re import urllib.request class DownTie ...

zimbra 8.x 安装RapidSSL

安装好zimbra后会自动生成一个自签名证书,但是之前我在rapidSSL申请了通配证书,所以只要将证书上传就可以了先下载证书的文件包括以下几个(购买的通配证书所以前缀是star) 1.服务器证书c ...

gcc编译参数-fPIC问题 `a local symbol' can not be used when making a shared object;

gcc -shared -o hack.so hack.c/usr/bin/ld: /tmp/ccUZREwA.o: relocation R_X86_64_32 against `a local s ...

WPF 系统托盘图标闪烁

WPF消息通知系统托盘,图标闪烁 1 using System.Windows.Forms; 2 3 using System.Windows.Threading; 4 5 public parti ...

大数据经验分享

大数据经验分享随着互联网的发展,尤其是近期互联网大会召开,再一次谈到大数据,大数据发展趋势已经成为一种必然.那么我们怎样去迎接这样一个新的数据时代?我们可以看到越来越多的人想学习大数据,可是却无从下 ...

50、BGP配置实验之社团属性community

1.社团属性community解析 BGP社团属性community: 可开启:BGP社团属性community为可选属性,默认不识别.可通过命令开启:neighbor x.x.x.x send-co ...

正则表达式-sed-用法详解

sed命令: sed是一种流编辑器,它是文本处理中非常使用的工具,能够完美的配合正则表达式使用.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern spac ...

听歌的石头给我说过他晚上有提问

http://t.cndesign.com/work/555989 http://t.cndesign.com/work/555987 http://t.cndesign.com/work/55598 ...

vue2.0+element-ui(01简单点的单页面)

前言: 在<Vue.js权威指南>刚出版的时候,自己就作为一名前端粉捧了一把场,可是真是应了那句"出来混,总是要还的!"这句话了,那时候信心满满的买来书想要认真研究的时 ...

【BZOJ1087】【SCOI2005】互不侵犯King 状态压缩动态规划水题都不用加特技

广告: #include <stdio.h> int main() { puts("转载请注明出处[vmurder]谢谢"); puts("网址:blog.c ...

AA 出现app:compileDebugJavaWithJavac

当配置好androidanotation后,使用注释时会出现如题的错误.其中错误的原因网上有挺多的帖子了,列举些网上回答的问题. 1.因为版本不是最新的问题,更新最新的sdk 2.设置JDK为本地的j ...

地址解析协议ARP：ARP欺骗

所谓ARP攻击,就是伪造IP和MAC地址进行的攻击或者欺骗,ARP攻击所产生的效果就是使目标主机(局域网)断网,甚至通过渗透可以窥探到对方的一些隐私,如一些登录账号和密码,对方在电脑上浏览哪些东西. ...

mysql 数据库问题com.mysql.jdbc.exceptions.jdbc4.CommunicationsException

本文转自:http://blog.csdn.net/zmzsoftware/article/details/6835604 MySQL第二天早上第一次连接超时报错,解决方法com.mysql.jdbc ...

浅析C++多线程编程理论与实践

写这篇博客之前,由于对多线程也不是很了解,一直觉得多线程是个很神奇的东西,但项目中又需要用到,所以借此机会学习了一下,也算做个入门总结吧,写下来总是好的!言归正传,首先介绍几个多线程相关的基本概念: ...

margin 与 padding

一.margin 内边距 1.margin常用于网页内部块与块之间的距离. 2.margin附有多个属性,分别是 margin-left[左] margin-top[上] margin-bottom ...

JavaScript:回调模式(Callback Pattern)

函数就是对象,所以他们可以作为一个参数传递给其它函数: 当你将introduceBugs()作为一个参数传递给writeCode(),然后在某个时间点,writeCode()有可能执行(调用)intr ...

手机端第一屏页面文章的展开和隐藏

本人做的是手机端的前端开发,事事处处都得从手机用户的体验着手考虑.大家都知道手机相对于pc来说要小很多,所要容纳的东西相对于pc来说也要少之又少.一些重要的东西又希望用户在打开手机网站的第一屏就能看到 ...

js iframe 与父窗体的调用

调子窗体 window.document.getElementById('vocabularymanagerIframe').contentWindow.gridStoreReload(obj); 调 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.