F1 score,micro F1score,macro F1score 的定义

2018年09月28日 19:30:08 wanglei_1996 阅读数 976

本篇博客可能会继续更新

最近在文献中经常看到precesion,recall，常常忘记了他们的定义，在加上今天又看到评价多标签分类任务性能的度量方法micro F1score和macro F2score。决定再把F1 score一并加进来把定义写清楚，忘记了再来看看。

F1score

F1score(以下简称F1)是用来评价二元分类器的度量，它的计算方法如下：

F1是用来衡量二维分类的，那形容多元分类器的性能用什么呢？micro F1score,和macro F2score则是用来衡量多元分类器的性能。

假设对于一个多分类问题，有三个类，分别记为1、2、3，

TPi是指分类i的True Positive；
FPi是指分类i的False Positive；
TNi是指分类i的True Negative；
FNi是指分类i的False Negative。

我们分别计算每个类的精度(precision)

macro 精度就是所有分类的精度平均值

同样，每个类的recall计算为

macro 召回就是所有分类的召回平均值

套用F1score的计算方法,macro F1score就是

micro F1score

假设对于一个多分类问题，有三个类，分别记为1、2、3，

TPi是指分类i的True Positive；
FPi是指分类i的False Positive；
TNi是指分类i的True Negative；
FNi是指分类i的False Negative。
接下来，我们来算micro precision

相应的micro recall则是

则micro F1score为

总结

如果各个类的分布不均衡的话，使用micro F1score比macro F1score 比较好，显然macro F1score没有考虑各个类的数量大小

参考
该网址一位答主的回答，我搬运过来

原文地址：https://www.cnblogs.com/hjlweilong/p/11032593.html

时间： 2024-10-29 19:19:24

F1 score,micro F1score,macro F1score 的定义的相关文章

机器学习中的 precision、recall、accuracy、F1 Score

1. 四个概念定义:TP.FP.TN.FN 先看四个概念定义: - TP,True Positive - FP,False Positive - TN,True Negative - FN,False Negative 如何理解记忆这四个概念定义呢? 举个简单的二元分类问题例子: 假设,我们要对某一封邮件做出一个判定,判定这封邮件是垃圾邮件.还是这封邮件不是垃圾邮件? 如果判定是垃圾邮件,那就是做出(Positive)的判定: 如果判定不是垃圾邮件,那就做出(Negative)的判定. Tru

分类问题的几个评价指标（Precision、Recall、F1-Score、Micro-F1、Macro-F1

轉自 https://blog.csdn.net/sinat_28576553/article/details/80258619 四个基本概念TP.True Positive 真阳性:预测为正,实际也为正 FP.False Positive 假阳性:预测为正,实际为负 FN.False Negative 假阴性:预测与负.实际为正 TN.True Negative 真阴性:预测为负.实际也为负. [一致判真假,预测判阴阳.] 以分类问题为例: 首先看真阳性:真阳性的定义是"预测为正,实际也

评估指标：ROC，AUC，Precision、Recall、F1-score

一.ROC,AUC ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣 . ROC曲线一般的横轴是FPR,纵轴是FPR.AUC为曲线下面的面积,作为评估指标,AUC值越大,说明模型越好.如下图: 二.Precision.Recall.F1-score Terminology and derivationsfrom a confusion matrix true positive (TP)

对accuracy、precision、recall、F1-score、ROC-AUC、PRC-AUC的一些理解

最近做了一些分类模型,所以打算对分类模型常用的评价指标做一些记录,说一下自己的理解.使用何种评价指标,完全取决于应用场景及数据分析人员关注点,不同评价指标之间并没有优劣之分,只是各指标侧重反映的信息不同.为了便于后续的说明,先建立一个二分类的混淆矩阵 ,以下各参数的说明都是针对二元分类 1.准确率 accuracy 准确率:样本中类别预测正确的比例,即准确率反映模型类别预

精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么？

作者:竹间智能 Emotibot链接:https://www.zhihu.com/question/30643044/answer/161955532来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 精确率(Precision)是指在所有系统判定的“真”的样本中,确实是真的的占比,就是TP/(TP+FP). 召回率(Recall)是指在所有确实为真的样本中,被判为的“真”的占比,就是TP/(TP+FN). FPR(False Positive Rate),又被称为“

freemarker 自己定义指令

1 简单介绍自己定义指令能够使用 macro 指令来定义,这是模板设计者所关心的内容. Java 程序猿若不想在模板中实现定义指令 ,而是在 Java 语言中实现指令的定义,这时能够使用freemarker.template.TemplateDirectiveModel 类来扩展 2 基本内容 macro 指令自身不打印不论什么内容,它仅仅是用来创建宏变量,所以就会有一个名为greet 的变量.在 <#macro greet> 和 </#macro> 之间的内容(称为宏定义

<27>【理解】02-结构体数组概念及定义＋【掌握】03-结构数组的初始化和遍历

[理解]02-结构体数组概念及定义结构体数组: 用来存放大量的结构体相同的结构体变量结构体数组定义: 结构体数组定义的第一种方式: 1)定义结构体的同时,定义数组 struct Student{ int age; char *name; int s_no; float score; }stu[5]; 结构体数组定义的第二种方式 2)先定义结构体,后定义数组 struct Student boy[5]; #include <stdio.h> int main(int argc, const

VB.NET中Form窗体运行时，按F1进入全屏状态

1.在KeyDown事件中添加: If e.KeyValue = 112 Then Me.WindowState = FormWindowState.Maximized End If 注:1.其中112是F1的键值,也可以定义其他键,参考键值见本博客随笔. 2.有不懂得请直接留言即可.

macro , nested , return指令

macro可以用于实现自定义指令,通过使用自定义指令,可以将一段模板片段定义成一个用户指令,使用macro指令的语法格式如下: < #macro name param1 param2 ... paramN> ... < #nested loopvar1, loopvar2, ..., loopvarN> ... < #return> ... < /#macro> 在上面的格式片段中,包含了如下几个部分: name:name属性指定的是该自定义指令的名字,使用