好记性不如烂笔头——关于精确度、召回率、F值、准确率

将数据挖掘中这些评测指标的基本概念做一整理,忘了的时候还可以来查一查。

精确度,有时也叫正确率,是英文中的precision而不是accuracy。表示正确识别为此类的样本数目(TP)/识别为此类的样本总数目(TP+FP)。FP就是那些原本不是此类但被错误的分为此类的样本数目。

召回率,这个名称容易使人把它和召回缺陷产品的比率联想到一起,完全不是一码事。所以另外一种翻译的名称更合适:查全率。表示正确识别为此类的样本数目(TP)/真实情况下的此类的样本数目(TP+FN)。那么真实情况包括哪些呢?一部分自然是正确分类的TP,另一部分就是那些被错误地分到了其他类的样本数目(FN)

所以,公式:

P=TP/(TP+FP)

R=TP/(TP+FN)

还是举个例子吧。网上多数介绍仅用两个分类举例,所以容易把FP和FN错误的当成一个数,其实应该是多个数的和。这里我举个3分类的例子。假定我们有24个样本,真实情况是10个red类,8个yellow类,6个blue类。

分类工具给出的结果如下:

a b c   <-- classified as

9 1 0 | a = red

1 7 0 | b = yellow

1 1 4 | c = blue

是这样看的:横向为真实情况,纵向为工具分类结果。即:有11个样本被当作red类。而这11个样本中,有9个确实是red类,还有一个其实是yellew,另一个其实是blue;有9个样本被当作yellow类。这9个样本当中,有7个确实是yellow,还有一个其实是red,另一个其实是blue;有4个样本被当作blue类。而这4个样本也确实是blue。

那么根据前面的公式,可以对red、yellow、blue分别计算正确率和查全率了。

P(red)=9/11  R(red)=9/10

P(yellow)=7/9  R(yellow)=7/8

P(blue)=4/4  R(blue)=4/6

那么我们从直观上感觉一下分类的好坏,正确率虽然很关键,但光有正确率是不够的。比如blue,正确率是100%,但其实只是把2/3的数据挑出来了,还有1/3搞错了。那么更极端的假想一下,如果某一类实际上有10000个样本,最后只分出一个,对是对了。此时正确率还是100%,但我们能认为这个分类结果是可以接受吗?显然不行。所以P值和R同时要比较高才好。于是有了F指标:

F=2*P*R/(P+R)

最后再来说说accuracy,这个通常翻译成准确率。也是一个综合指标:

A=(TP + TN)/(P+N),表示正确分类的样本数目/所有样本总数目。同样,这个分子的写法也容易让人误认为是两个数的和,其实不止。

对于上面那个例子来说,准确率应该是:

A=9+7+4/10+8+6

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-19 23:07:50

好记性不如烂笔头——关于精确度、召回率、F值、准确率的相关文章

准确率,召回率,F值,ROC,AUC

度量表 1.准确率 (presion) p=TPTP+FP 理解为你预测对的正例数占你预测正例总量的比率,假设实际有90个正例,10个负例,你预测80(75+,5-)个正例,20(15+,5-)个负例 实际上你的准确率为75/80=0.9375,但这个评价指标有什么问题呢,想想就知道,这里你并没有用到实际的正例数,那么仅仅靠你猜中的正例作为分母,你并不知道实际的正例有多少,你看召回率为75/90=0.83,就是说你的猜测局限于预测范围 2.召回率 (recall)r=TPTP+FN 理解为你预测

Python学习中的随笔,好记性不如烂笔头

本文 为博主看了 vamei 的blog 写下的随笔 . 致敬Vamei 1.type()   可以显示参数的类型 如 : a=12   type(a) 为 int 2.python的基本类型 为 int float bool string   如 int :  i=1   ,   float :  f=12.5  ,  bool : b= True  or  Flase , string :  s='Hello , word !' 使用前无需声明类型  即 动态类型 3.1序列有 tuple

从“好记性不如烂笔头”“记问之学不足为人师”到“一事不知是我之耻”

“好记性不如烂笔头”错在一笔记容易丢失,二考验随时发生而笔记常不随身.因此记到大脑里最可靠. “记问之学不足为人师”错在低估记忆力的作用而盲目推崇推理逻辑,这像不打地基盖楼,要不不牢靠要不会垮. “一事不知是我之耻”这是一种认真积极的态度,这样才能应付随时出现的挑战. 2017年3月12日00:34:22

好记性不如烂笔头

今天再次深刻领悟这个技能.tm竟然忘记博客园的用户名了.... 好记性不如烂笔头,布布扣,bubuko.com

开篇记(好记性不如烂笔头)

入园两年零三个月,我居然没有一点东西记载下来实在是不应该. 爷爷曾经告诉过我,好记性不如烂笔头.他告诉了我最鲜明的例子.爷爷的脑子一直很好用,记性也是比常人好上一些,当然这也直接导致了爷爷的性格很是高傲.爷爷年轻的时候喜欢舞文弄墨什么的,所以呢每逢人家红白喜事的时候都会去人家及里面瞅上一眼,看看人家送上的喜联或者挽联.有此爱好的还有我的一个另一个宋爷爷,他们经常约好一起的.爷爷老是自信于强悍的记忆能力,每次都是记在脑子中,而宋爷爷却每次都将那些很好的对联记载一个小本子上面.如今爷爷年纪越来越大,

好记性不如烂笔头89-spring3学习(10)-spring3常用schema(持续整理)

Spring3有很多的schema,这些schema对应很多不同的功能.使用这些常用的schema,能让我们避免重复发明轮子,提高我们的开发效率. 我以为这是一个很常见的信息,到网上随便整理下就能完成,可能用的关键词不对,怎么找也没有找到相对比较全面的. 正所谓,好记性不如烂笔头,自己动手把自己能收集到的整理下来,以后需要找资料也能方便点. spring-beans-3.0.xsd 用途:spring3最主要的schema,用于配置bean 命名空间: http://www.springfram

好记性不如烂笔头48-java拦截器-JDK自带动态代理和CGLIB效率比较(3)

Java中自带的动态代理的类必须要实现一个接口,而且据说使用反射的效率也并不是很高.于是CGLIB就诞生了. 使用CGLib实现动态代理,完全不受代理类必须实现接口的限制,而且CGLib底层采用ASM字节码生成框架,使用字节码技术生成代理类,理论上比使用Java反射效率要高. 那么我们测试下,这个运行的效率如何. 1. 测试的准备情况 准备1:好记性不如烂笔头46-java拦截器-彻底理解动态代理的概念(1) http://blog.csdn.net/ffm83/article/details/

博客开通啦,好记性不如烂笔头

好记性不如烂笔头,勤能补拙.2016年,我即将步入工作,结束十多年的学生生活.如果说,人生每一个阶段都是一个新的开始,那么,今年又是我新生的一年. 新年新希望, 第一:希望自己能够工作顺利,在自己的岗位上做一个称职又出色的员工 第二:希望自己能够每天都开开心心的 第三:努力变美,努力减肥.多读书,多看报,少吃零食多运动- 第四:努力学习.学习才能使自己更上一层楼,才能让自己实现自己的愿望,学无止境,自制,坚持,总结,记录. 第五:希望家人和朋友们都开开心心的,心想事成万事如意. 第六:希望,我和

好记性不如烂笔头(零)

俗话说,好记性不如烂笔头! 在平常的开发工作中,很多时候我们都会用到一些代码量比较小,但是却很有用的功能,但是,都只是写过就算,下一次再想起来用的时候,已经不知道该去哪儿找了. 常常因为这些小点而浪费时间,也随着年纪渐长,智商有限,还是靠记下来,以备不时之需呀. 获取圆形图片 /** * bitmap 要进行剪裁的位图 * size 剪裁的圆形图片的大小 */ public static Bitmap getCroppedRoundBitmap(Bitmap bitmap, int size)