P-R曲线

P-R曲线刻画查准率和查全率之间的关系，查准率指的是在所有预测为正例的数据中，真正例所占的比例，查全率是指预测为真正例的数据占所有正例数据的比例。

即：查准率P=TP／(TP + FP) 查全率=TP／（TP+FN）

查准率和查全率是一对矛盾的度量，一般来说，查准率高时，查全率往往偏低，查全率高时，查准率往往偏低，例如，若希望将好瓜尽可能多选出来，则可通过增加选瓜的数量来实现，如果希望将所有的西瓜都选上，那么所有的好瓜必然都被选上了，但这样查准率就会较低；若希望选出的瓜中好瓜比例尽可能高，则可只挑选最有把握的瓜，但这样就难免会漏掉不少好瓜，使得查全率较低。

在很多情况下，我们可以根据学习器的预测结果对样例进行排序，排在前面的是学习器认为最可能是正例的样本，排在后面的是学习器认为最不可能是正例的样本，按此顺序逐个把样本作为正例进行预测，则每次可计算当前的查全率和查准率，以查准率为y轴，以查全率为x轴，可以画出下面的P-R曲线。

如果一个学习器的P-R曲线被另一个学习器的P-R曲线完全包住，则可断言后者的性能优于前者，例如上面的A和B优于学习器C，但是A和B的性能无法直接判断，但我们往往仍希望把学习器A和学习器B进行一个比较，我们可以根据曲线下方的面积大小来进行比较，但更常用的是平衡点或者是F1值。平衡点（BEP）是查准率=查全率时的取值，如果这个值较大，则说明学习器的性能较好。而F1 = 2 * P * R ／( P + R )，同样，F1值越大，我们可以认为该学习器的性能较好。

联合建模(BJ)P-R曲线

原文地址：https://www.cnblogs.com/gczr/p/10137063.html

时间： 2024-12-23 12:57:33

P-R曲线的相关文章

机器学习：评价分类结果（ROC 曲线）

一.基础理解 1)定义 ROC(Receiver Operation Characteristic Curve) 定义:描述 TPR 和 FPR 之间的关系: 功能:应用于比较两个模型的优劣: 模型不限于是否通过极度偏斜的数据训练所得: 比较方式:ROC 曲线与坐标图形边界围成的面积,越大模型越优: TPR(True Positive Rate):真正率:被预测为正的正样本结果数 / 正样本实际数:TPR = TP /(TP + FN): TNR(True Negative Rate):真负率:

用Python开始机器学习（7：逻辑回归分类） --好！！

from : http://blog.csdn.net/lsldd/article/details/41551797 在本系列文章中提到过用Python开始机器学习(3:数据拟合与广义线性回归)中提到过回归算法来进行数值预测.逻辑回归算法本质还是回归,只是其引入了逻辑函数来帮助其分类.实践发现,逻辑回归在文本分类领域表现的也很优秀.现在让我们来一探究竟. 1.逻辑函数假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小

opencv笔记（十七）——使用霍夫变换检测直线

一般我们在检测物体轮廓的时候,会有检测直线的需求,这时可以用到OpenCV当中的霍夫变换实现. 霍夫变换的原理的简单阐述见:http://docs.opencv.org/doc/tutorials/imgproc/imgtrans/hough_lines/hough_lines.html#hough-lines 简单来讲,对于单个像素来说,它可能是由许多直线经过的,我们通过一个点可以构造无数条直线. 对于一个像素的位置(x, y),从笛卡尔坐标和极坐标两个角度,我们可以有进而得到上

MATLAB学习笔记（十）——MATLAB图形句柄

(一)图形对象及其句柄一.图形对象 MATLAB图形对象包括: 1.MATLAB每一个具体图形一定包括计算机屏幕和图形窗口两个对象二.图形对象句柄 1.定义 MATLAB在创建每一个图形对象时,都会给该对象分配一个唯一确定的值,称其为图形对象句柄. PS:(1)计算机屏幕句柄默认为0. (2)图形窗口对象的句柄值为一正整数,并显示在窗口标题栏中 (3)其他图形对象的句柄为浮点数. 2.获取已有对象的句柄 3.一个demo x=linspace(0,2*pi,30); y=sin(x); h0

磁珠基础知识

一.认识磁珠磁珠专用于抑制信号线.电源线上的高频噪声和尖峰干扰,还具有吸收静电脉冲的能力.磁珠是用来吸收超高频信号,象一些RF电路,PLL,振荡电路,含超高频存储器电路(DDRSDRAM,RAMBUS等)都需要在电源输入部分加磁珠,而电感是一种蓄能元件,用在LC振荡电路,中低频的滤波电路等,其应用频率范围很少超过50MHZ. 磁珠有很高的电阻率和磁导率,等效于电阻和电感串联,但电阻值和电感值都随频率变化. 磁珠(Ferrite bead)的等效电路是一个DCR电阻串联一个电感并联一个电容和一个

MATLAB图形界面设计（上）

参考https://www.cnblogs.com/BlueMountain-HaggenDazs/p/4307777.html 一.图形句柄 1.定义 MATLAB在创建每一个图形对象时,都会给该对象分配一个唯一确定的值,称其为图形对象句柄. PS:(1)计算机屏幕句柄默认为0. (2)图形窗口对象的句柄值为一正整数,并显示在窗口标题栏中 (3)其他图形对象的句柄为浮点数. 2.获取已有对象的句柄直接输入该代码结果如下图: (1)gcf: (2)gca: (3)gco: 代码示例: x=li

西瓜书打卡Task6

过拟合与欠拟合及其解决方法我们在进行模型训练的时候会出现模型不能够很好地拟合数据的情况,这个时候就需要我们来判断究竟现在的模型是欠拟合还是过拟合. 1. 欠拟合首先欠拟合就是模型没有很好地捕捉到数据特征,不能够很好地拟合数据 training error cross validation error test error 解决方法: 1)添加其他特征项,有时候我们模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决.例如,“组合”.“泛化”.“相关性”三类特征是特征添加

R语言ROC曲线下的面积 - 评估逻辑回归中的歧视

原文链接:http://tecdat.cn/?p=6310 在讨论ROC曲线之前,首先让我们在逻辑回归的背景下考虑校准和区分之间的区别. 良好的校准是不够的对于模型协变量的给定值,我们可以获得预测的概率.如果观察到的风险与预测的风险(概率)相匹配,则称该模型已被很好地校准.也就是说,如果我们要分配一组值的大量观察结果,这些观察结果的比例应该接近20%.如果观察到的比例是80%,我们可能会同意该模型表现不佳 - 这低估了这些观察的风险. 我们是否应满足于使用模型,只要它经过良好校准?不幸的是.为

R语言绘制KS曲线；R语言实现KS曲线

更多内容请关注公众号<大数据风控的一点一滴> 将代码封装在函数PlotKS_N里,Pred_Var是预测结果,可以是评分或概率形式:labels_Var是好坏标签,取值为1或0,1代表坏客户,0代表好客户:descending用于控制数据按违约概率降序排列,如果Pred_Var是评分,则descending=0,如果Pred_Var是概率形式,则descending=1:N表示在将数据按风险降序排列后,等分N份后计算KS值. PlotKS_N函数返回的结果为一列表,列表中的元素依次为KS最大值

R语言中绘制ROC曲线和PR曲线

接收器操作特性(ROC)曲线可能是评估评分分类器的预测性能的最常用的度量. 预测正类(+1)和负类(-1)的分类器的混淆矩阵具有以下结构: 预测/参考类 +1 -1 +1 TP FP -1 FN TN 这里,TP表示真阳性的数量(模型正确预测正类),FP表示误报的数量(模型错误地预测正类),FN表示假阴性的数量(模型错误地预测阴性类),TN表示真阴性的数量(模型正确预测阴性类). ROC曲线在ROC曲线中,相对于假阳性率(FPR,x轴)绘制真阳性率(TPR,y轴).这些数量定义如下: TPRF

猜你喜欢

How Node.js Multiprocess Load Balancing Works

As of version 0.6.0 of node, load multiple process load balancing is available for node. The concept ...

龙威零式-团队博客

团队介绍开发小组: 谷大鑫: 热爱编程,技术狂魔,可以对感兴趣的技术钻研到茶饭不思,队伍的技术中坚.标签:整个队伍里最靠谱的人. 杨金键: 计院学生,男,未曾有相关开发经验,不是大腿,照片是表哥的, ...

HDU 1047 Integer Inquiry 大数相加 string解法

本题就是大数相加,题目都不用看了. 不过注意的就是HDU的肯爹输出,好几次presentation error了. 还有个特殊情况,就是会有空数据的输入case. #include <stdio ...

Office 365系列之九：使用Windows PowerShell管理O365平台

正如之前我们说的,通过O365管理中心.Exchange 管理中心.Lync管理中心SharePoint 管理中心能做的事情和能够实现的需求是远远满足不了客户的时间需求的.可以使用用于 Windows ...

用jsonp来解决跨域问题的三种简单的方法

jsonp实现跨域的方法使用ajax方法获取数据不能跨域,为了解决这个问题,普遍使用jsonp来实现跨域,下面是对jsonp方法的简单总结: 例子:假如想获取京东的评论的数据,可以在京东的评论面板打 ...

HDOJ-ACM1425 sort 简单hash应用

其实快排也可以通过这个问题~不是考点没想到考点是这个,简单hash应用,空间换时间初始化一个长度为1000001的数组(由于数字的范围为[-500000,500000]) 如果存在这个数m,数组下 ...

矩阵乘法计算量估算

当使用stack等stl库时,如果使用s.pop(),s.top(),则必须判定stack是否为空. #include<iostream> #include<vector> # ...

linux里的bootproto的none,static,dhcp有什么区别

这个是网络配置参数:BOOTPROTO=static 静态IP BOOTPROTO=dhcp 动态IP BOOTPROTO=none 无(不指定)通常情况下是dhcp或者static,通过指定方式的办 ...

[转载]github在线更改mysql表结构工具gh-ost

GitHub正式宣布以开源的方式发布gh-ost:GitHub的MySQL无触发器在线更改表定义工具! gh-ost是GitHub最近几个月开发出来的,目的是解决一个经常碰到的问题:不断变化的产品需求 ...

HDU - 3072 Intelligence System(强连通分量＋类最小生成树)

题目大意:有一个人想要将消息告诉给所有人(在同一个强连通分量里面的人可以相互转告,费用为0),问所有人都知道消息的最小花费是多少解题思路:求出所有的强连通分量,然后将其缩点,桥就是连接其中的边因为 ...

Java之JSP和Servlet基础知识。

JSP基础 JSP起源 JSP,Java Server Pager的简称.由SUN倡导并联合其它公司创建. JSP是一门脚本语言 JSP可以嵌入到HTML中 JSP拥有Java语言的所有特性面向对象 ...

遇到这种水汪汪的极品妹子

http://club.tech.sina.com.cn/thread-10784096-1-1.html http://club.tech.sina.com.cn/thread-10784088-1 ...

[Aaronyang] 写给自己的WPF4.5 笔记10[层次数据需求处理，TreeView绿色文章1/4]

我的文章一定要做到对读者负责,否则就是失败的文章 --------- www.ayjs.net aaronyang技术分享 AY留言: 文章根据难易,我根据游戏的规则进行了分色,希望读者 ...

Oracle 11g XE 试用记录

安装之前先删除系统环境变量中的oracle_home等配置(如果存在的话): 如果安装后出现Web管理界面不能访问或者数据库不能连接的情况,卸载再多安装几次可能就正常了.状态不正常时,可以使用 C:\ ...

eclipse字母大小写转换的快捷键

大写转换小写 ctrl+shift+y 小写转换大写 ctrl+shift+x

POJ 3356 AGTC （编辑距离 DP）

Description Let x and y be two strings over some finite alphabet A. We would like to transform x int ...

安装Https证书

安装证书 IIS 6 支持PFX格式证书,下载包中包含PFX格式证书和密码文件.以沃通证书为例: 文件说明: 1. 证书文件214083006430955.pem,包含两段内容,请不要删除任何一段内容 ...

Java集合源码分析（七）HashMap<K, V>

一.HashMap概述 HashMap基于哈希表的 Map 接口的实现.此实现提供所有可选的映射操作,并允许使用 null 值和 null 键.(除了不同步和允许使用 null 之外,HashMap ...

POJ 3186Treats for the Cows(区间DP)

题目链接:http://poj.org/problem?id=3186 题目大意:给出的一系列的数字,可以看成一个双向队列,每次只能从队首或者队尾出队,第n个出队就拿这个数乘以n,最后将和加起来,求最 ...

希望可以帮到正在奔波的你—常见安卓面试题

目录 1.怎么实现通知栏到聊天界面的跳转 3 2.聊天界面左右分隔怎么实现,怎么实现优化使其不出现错位 3 3.视频,音频的上传 3 4.http协议和soap协议的区别 3 5.http和https ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.