斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）

一般来说，召回率和查准率的关系如下：1、如果需要很高的置信度的话，查准率会很高，相应的召回率很低；2、如果需要避免假阴性的话，召回率会很高，查准率会很低。下图右边显示的是召回率和查准率在一个学习算法中的关系。值得注意的是，没有一个学习算法是能同时保证高查准率和召回率的，要高查准率还是高召回率，取决于自己的需求。此外，查准率和召回率之间的关系曲线可以是多样性，不一定是图示的形状。

如何取舍查准率和召回率数值：

一开始提出来的算法有取查准率和召回率的平均值，如下面的公式average=（P+R）/2。显然，在给出的三个算法当中，算法3的平均值是最高的，然而通过查准率（0.02）和召回率（1.0）可以看出这并不是一个很好的模型。因此，取平均值这个评估模式是不可取的。

如果采用F score算法来同时评估查准率和召回率，则是比较有用的算法。分子的PR决定了查准率（P）和召回率（R）必须同时比较大，才能保证F score数值比较大。假如查准率或者召回率很低，接近于0，直接导致的后果PR值非常低，趋近于0，也就是F score也很低。

此时再比较三个算法，可发现算法1是最优的，同时我们观察到算法3在这个公式中F score值是最低的。很好的说明了算法3不是一个很好的模型（查准率太低）。说明F score是一个很好的同时评估查准率和召回率的公式。

原文地址：https://www.cnblogs.com/chenwenyan/p/8325476.html

时间： 2024-07-29 10:02:48

斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）的相关文章

斯坦福大学公开课机器学习：machine learning system design | error metrics for skewed classes（偏斜类问题的定义以及针对偏斜类问题的评估度量值：查准率（precision）和召回率（recall））

上篇文章提到了误差分析以及设定误差度量值的重要性.那就是设定某个实数来评估学习算法并衡量它的表现.有了算法的评估和误差度量值,有一件重要的事情要注意,就是使用一个合适的误差度量值,有时会对学习算法造成非常微妙的影响.这类问题就是偏斜类(skewed classes)的问题.什么意思呢.以癌症分类为例,我们拥有内科病人的特征变量,并希望知道他们是否患有癌症,这就像恶性与良性肿瘤的分类问题.假设y=1表示患者患有癌症,假设y=0表示没有得癌症,然后训练逻辑回归模型.假设用测试集检验了这个分类模型,并

斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）

斯坦福大学公开课机器学习：machine learning system design | trading off precision and recall（F score公式的提出：学习算法中如何平衡（取舍）查准率和召回率的数值）的相关文章

斯坦福大学公开课机器学习：machine learning system design | error metrics for skewed classes（偏斜类问题的定义以及针对偏斜类问题的评估度量值：查准率（precision）和召回率（recall））

斯坦福大学公开课机器学习：machine learning system design | data for machine learning（数据量很大时，学习算法表现比较好的原理）

斯坦福大学公开课机器学习：advice for applying machine learning - deciding what to try next（设计机器学习系统时，怎样确定最适合、最正确的方法）

斯坦福大学公开课机器学习： advice for applying machine learning | regularization and bais/variance（机器学习中方差和偏差如何相互影响、以及和算法的正则化之间的相互关系）

斯坦福大学公开课机器学习：advice for applying machine learning | learning curves （改进学习算法：高偏差和高方差与学习曲线的关系）

斯坦福大学公开课机器学习： neural networks learning - autonomous driving example（通过神经网络实现自动驾驶实例）

斯坦福大学公开课机器学习：Neural network-model representation（神经网络模型及神经单元的理解）

Stanford机器学习笔记-7. Machine Learning System Design

斯坦福大学公开课：iOS 7应用开发笔记