PR曲线的计算及绘制

　　　　在linear model中，我们对各个特征线性组合，得到linear score,然后确定一个threshold，linear score ＜ threshold 判为负类，linear score ＞ threshold 判为正类。画PR曲线时，我们可以想象threshold 是不断变化的。首先，threshold 特别大，这样木有一个是正类，我们计算出查全率与查准率；然后 threshold 减小，只有一个正类，我们计算出查全率与查准率；然后 threshold再减小，有2个正类，我们计算出查全率与查准率；threshold减小一次，多出一个正类，直到所有的类别都被判为正类。然后以查全率为横坐标，差准率为纵坐标，画出图形即可。

例如，有

实际类别	linear score	threshold 为5	threshold 为4	threshold 为3	threshold 为2	threshold 为1
+	5.2	+	+	+	+	+
+	4.45	-	+	+	+	+
-	3.5	-	-	+	+	+
-	2.45	-	-	-	+	+
-	1.65	-	-	-	-	+
		1 / 1	2 / 2	2 / 3	2 / 4	2 / 5	查全率
		1 / 5	2 / 5	3 / 5	4 / 5	5 / 5	差准率

查全率：预测为正的里面，实际为正的比例。

查准率：预测为正，实际为正占的比例。

 1 import matplotlib
 2 import numpy as np
 3 import matplotlib.pyplot as plt
 4 Recall = np.array([0,1/5,2/5,3/5,4/5,5/5])  #从0开始更加平滑，美观，实际中，数据量很大时，趋近0。
 5 Precison = np.array([1/1,2/2,2/3,2/4,2/5,0])
 6 plt.figure()
 7 plt.ylim(0,1.1)
 8 plt.xlabel("Recall")
 9 plt.xlim(0,1.1)
10 plt.ylabel("Precison")
11 plt.plot(Recall,Precison)
12 plt.show()

时间： 2024-12-28 21:03:47

PR曲线的计算及绘制的相关文章

ROC曲线和PR曲线绘制【转】

TPR=TP/P :真正率:判断对的正样本占所有正样本的比例. Precision=TP/(TP+FP) :判断对的正样本占判断出来的所有正样本的比例 FPR=FP/N :负正率:判断错的负样本占所有负样本的比例. Recall = TP/(TP+FN) = TP/P,就是TPR. ROC曲线:横轴是FPR,纵轴是TPR. 绘制出的曲线应该在y=x直线之上,曲线积分的结果就是AUC的值.AUC越大则系统分类性能越好. PR曲线:横轴是Precision,纵轴是recall. precision

【ROC曲线】关于ROC曲线、PR曲线对于不平衡样本的不敏感性分析说引发的思考

ROC曲线在网上有很多地方都有说ROC曲线对于正负样本比例不敏感,即正负样本比例的变化不会改变ROC曲线.但是对于PR曲线就不一样了.PR曲线会随着正负样本比例的变化而变化.但是没有一个有十分具体和严谨地对此做出过分析和论证(至少我没有找到). 此处记为结论1: 结论1:PR曲线会随着正负样本比例的变化而变化:但是ROC曲线不会. 此处我就这一问题进行了详细的分析论证,并在这个过程中引发了很多思考. 首先,如何分析这个问题呢? 看下ROC曲线是由TPR和FPR组成的下面我们这样来分析这个问题

图像检测经典的评估方式——PR曲线，ROC曲线

Keywords: PR curve, ROC curve, Machine Learning, image processing 为了帮助大家理解,比如我们需要检测一个图像中的人,分类器将图像上的每个像素划分为人和非人像素,目标是人,所以检测为人的像素用Positives表示,检测为非人的像素用Negatives来表示,检测到了需要报告,检测到不是需要拒绝,检测到了实际不是则为误报(错误地报告)或错检(非目标当成目标了),该检测到的没有检测到则为漏报或漏检 True/False = 正确地/错

P-R曲线

P-R曲线刻画查准率和查全率之间的关系,查准率指的是在所有预测为正例的数据中,真正例所占的比例,查全率是指预测为真正例的数据占所有正例数据的比例. 即:查准率P=TP/(TP + FP) 查全率=TP/(TP+FN) 查准率和查全率是一对矛盾的度量,一般来说,查准率高时,查全率往往偏低,查全率高时,查准率往往偏低,例如,若希望将好瓜尽可能多选出来,则可通过增加选瓜的数量来实现,如果希望将所有的西瓜都选上,那么所有的好瓜必然都被选上了,但这样查准率就会较低:若希望选出的瓜中好瓜比例尽可能高,则可只

查全率（Recall），查准率（Precision），灵敏性（Sensitivity），特异性（Specificity），F1，PR曲线，ROC，AUC的应用场景

之前介绍了这么多分类模型的性能评价指标(<分类模型的性能评价指标(Classification Model Performance Evaluation Metric)>),那么到底应该选择哪些指标来评估自己的模型呢?答案是应根据应用场景进行选择. 查全率(Recall):recall是相对真实的情况而言的:假设测试集里面有100个正类,如果模型预测出其中40个是正类,那模型的recall就是40%.查全率也称为召回率,等价于灵敏性(Sensitivity)和真正率(True Positive

ROC曲线 VS PR曲线

sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程,QQ:231469242) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share https://www.plob.org/article/12476.html(原文链接) 初识ROC曲线 1. RO

精确率与召回率，RoC曲线与PR曲线

在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我们需要搞清楚几个拗口的概念: 1. TP, FP, TN, FN True Positives,TP:预测为正样本,实际也为正样本的特征数 False Positives,FP:预测为正样本,实际为负样本的特征数 True Negatives,TN:预测为负样本,实际也为负样本的特征数 False Negatives,

计算字符串绘制所需宽高

[str boundingRectWithSize: options: attributes: context:]; 可以用该方法在绘制之前计算需要多大空间. 参数 size 宽高限制,用于计算文本绘制时占据的矩形块. options 文本绘制时的附加选项. context context上下文.包括一些信息,例如如何调整字间距以及缩放.最终,该对象包含的信息将用于文本绘制.该参数可为 nil . 返回值一个矩形,大小等于文本绘制完将占据的宽和高. size 参数是一个constraint ,

R语言中绘制ROC曲线和PR曲线

接收器操作特性(ROC)曲线可能是评估评分分类器的预测性能的最常用的度量. 预测正类(+1)和负类(-1)的分类器的混淆矩阵具有以下结构: 预测/参考类 +1 -1 +1 TP FP -1 FN TN 这里,TP表示真阳性的数量(模型正确预测正类),FP表示误报的数量(模型错误地预测正类),FN表示假阴性的数量(模型错误地预测阴性类),TN表示真阴性的数量(模型正确预测阴性类). ROC曲线在ROC曲线中,相对于假阳性率(FPR,x轴)绘制真阳性率(TPR,y轴).这些数量定义如下: TPRF

猜你喜欢

SuperSocket入门（四）-命令行协议

前面已经了解了supersocket的一些基本的属性及相关的方法,下面就进入重点的学习内容,通信协议.在没有看官方的文档之前,对于协议的理解首先想到的是TCP和UDP协议.TCP 和 UDP 是传输层 ...

《高可用MySQL》读书笔记1 – Windows环境下压缩版MySQL安装

近日在读O'REILIY系列的<高可用MySQL>, 自然少不了主从(Master-Slave)配置和横向扩展相关的内容.Master-Slave这东西吧,在许多公司都是标配,开发中基本天 ...

如何在linux环境下安装yaf

我本机的环境配置 linuxMint17.1 php5.5 nginx1.4.6 下面开始安装下载最新的yaf包 http://pecl.php.net/package/yaf 我下载的最新版本为2 ...

二级求最低分

//已知学生的记录有学号和学习成绩构成N名学生的数据已存入a的结构体数组中.编写函数fun找出最低的学生记录斌通过形参返回主函数 void fun(STU a[], STU *s) { int i; ...

Spring Test 整合 JUnit 4 使用

这两天做Web开发,发现通过spring进行对象管理之后,做测试变得复杂了.因为所有的Bean都需要在applicationContext.xml中加载好,之后再通过@Resource去取得.如果每次 ...

两个IP实现IIS和Apache公用80端口的设置方法

1. 打开命令提示符并确保您位于 X:\Inetpub\Adminscripts 文件夹(其中 X 是 IIS 安装驱动器)中.为此,请在命令提示符下键入以下命令行: X: CD \Inetpub\A ...

Toxy新手教程

Neuzilla出品官方网站:http://toxy.codeplex.comQQ群:297128022 Toxy是干嘛用的?它是.NET平台上的文件抽取框架,主要解决各种格式的内容抽取问题,比如p ...

Java解释器模式（Interpreter模式）

Interpreter定义:定义语言的文法,并且建立一个解释器来解释该语言中的句子. Interpreter似乎使用面不是很广,它描述了一个语言解释器是如何构成的,在实际应用中,我们可能很少去构造一个 ...

软件工程作业--找水王续

题目要求: •三人行设计了一个灌水论坛.信息学院的学生都喜欢在上面交流灌水,传说在论坛上有一个“水王”,他不但喜欢发帖,还会回复其他ID发的每个帖子.坊间风闻该“水王”发帖数目超过了帖子数目的一半. ...

.Net常用技巧_将DataGridView的内容转换成DataTable

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...

函数是一个组织在一起的一组以执行特定任务的语句.R语言有大量的内置函数,用户也可以创建自己的函数. 在R语言中的函数是一个对象,所以R语言解释器为能够通过控制到该函数,带有参数可能是函数必要完成的操作 ...

正则正向预查

[Measures].[抓取数据].[名称].&[58同城].[名称] 正则表达式&\[([^.]+)(?=) Match m = Regex.Match("[Measure ...

修改 myeclipse8.5 servlet 模板

在myeclipse8.5的安装目录下找到 \Common\plugins下的com.genuitec.eclipse.wizards_8.5.0.zmyeclipse75020090612.jar ...

CentOS系统上编译、安装、配置OpenCV

声明:本文是个人根据相关博客资料加上自己的经验整理,在此分享以供大家学习交流! 假设CentOS系统下的CodeBlocks已经安装完成,下面我们要在CentOS平台下编译OpenCV,并在CodeB ...

sql server 调优----索引缺失

SELECT mig.index_group_handle, mid.index_handle, CONVERT (decimal (28,1), migs.avg_total_user_cost * ...

美国妈25条规范让孩子人人爱

BWCHINESE中文网讯,如何能培养一个有教养而又模范的孩子?美国父母网站总结发表了25条注意事项,只要孩子在九岁前学会这些礼貌语言和行为,他们就会成为人见人爱的模范孩子. 1,如果孩子要什么,要很 ...

web项目打包成exe在windows下一键安装 jdk+Tomcat+mysql

最近因为公司销售人员不懂软件,所以每次部署项目都需要技术人员到客户现场进行部署,很不方便.所以公司就让把我们的项目做成傻瓜式安装,这样就可以让销售人员去安装,也给技术省了很多事.我在网上找了很多教程但 ...

java中的注解(Annotation)

转载:https://segmentfault.com/a/1190000007623013 简介注解,java中提供了一种原程序中的元素关联任何信息.任何元素的途径的途径和方法. 注解是那些插入到 ...

mysql日期相关的函数

1.获取当前时间: /** 获得当前日期+时间(date + time)函数:now(), 常用 **/ select now() from dual; /** 获取当前时间戳,current_tim ...

【软测试】（两）计算机组成原理-cpu

cpu,中文名称中央处理单元,central processing unit.系统的核心,用于数据的处理,算术以及逻辑运算和控制程序的运行. 组成运算器从字面上就能够理解到.运算器主要用来对于逻辑 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.019 s.