为何选用F1值(调和平均数)衡量P与R?

article/2025/11/7 5:07:47

二分类问题的性能度量为何选用 F 1 F_1 F1 值?

已知混淆矩阵

prediction positiveprediction negative
actuality positiveTrue Positive(TP)False Negative(FN)
actuality negativeFalse Positive(FP)True Negative(TN)

其中:Precise(精确率/查准率)= T P T P + F P \frac {TP} {TP+FP} TP+FPTP,表示所有预测为positive的集合中实际为positive的频率;
Recall(召回率/查全率)= T P T P + F N \frac {TP} {TP+FN} TP+FNTP,表示所有实际为positive的集合中预测为positive的频率。

1、“P-R”曲线

对我们来说, P P P R R R 都为1的模型是最完美的,但实际情况却并不像我们想的那样,通过“ P P P- R R R”曲线,对模型判断

P-R曲线

图片来源:http://shichaoxin.com/2018/12/03/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80-%E7%AC%AC%E4%B8%89%E8%AF%BE-%E6%A8%A1%E5%9E%8B%E6%80%A7%E8%83%BD%E5%BA%A6%E9%87%8F/

为了防止极端小的 P 和 R P 和 R PR 值影响我们对模型的判断,一般通过曲线下面积或 P = R P=R P=R 的平衡点作为判别标准。以平衡点判别被认为过于简单。

2、 F 1 F_1 F1值(P和R的调和平均数)

引如 F 1 F_1 F1值作为二分类问题的模型性能度量标准
F 1 = 2 P R P + R F_1=\frac{2PR}{P+R} F1=P+R2PR
这里 F 1 F_1 F1是基于 P P P R R R 的调和平均数,即 F 1 F_1 F1 的倒数为 P P P R R R 的倒数之和的二分之一 1 F 1 = ( 1 P + 1 R ) × 1 2 \frac{1}{F_1}=(\frac{1}{P}+\frac{1}{R})\times\frac{1}{2} F11=(P1+R1)×21
在统计学中,调和平均数( F F F)、几何平均数( G G G)、算数平均数( X ‾ \overline X X)
它们之间的关系用公式表示为
F ≤ G ≤ X ‾ F\le G\le \overline X FGX
其中, F = 2 a b a + b F=\frac{2ab}{a+b} F=a+b2ab G = a b G=\sqrt{ab} G=ab X ‾ = a + b 2 \overline X=\frac{a+b}{2} X=2a+b,当且仅当 a = b a=b a=b 时上面等式成立

证明如下:

假设存在 a , b > 0 a,b\gt 0 a,b>0,则

( a + b ) 2 − ( 2 a b ) 2 (a+b)^{2}-(2\sqrt{ab})^{2} (a+b)2(2ab )2
= a 2 + b 2 + 2 a b − 4 a b =a^{2}+b^{2}+2ab-4ab =a2+b2+2ab4ab
= a 2 + b 2 − 2 a b =a^{2}+b^{2}-2ab =a2+b22ab
= ( a − b ) 2 ≥ 0 =(a-b)^{2}\ge 0 =(ab)20,当且仅当 a = b a=b a=b 时等式成立
( a + b ) 2 ≥ ( 2 a b ) 2 (a+b)^{2}\ge (2\sqrt{ab})^{2} (a+b)2(2ab )2
已知 a , b > 0 a,b\gt 0 a,b>0,则 a + b ≥ 2 a b a+b\ge2\sqrt{ab} a+b2ab

推出 2 a b a + b ≤ a b a b ≤ a b ≤ a + b 2 \frac{2ab}{a+b}\le\frac{ab}{\sqrt{ab}}\le\sqrt{ab} \le\frac{a+b}{2} a+b2abab abab 2a+b
当且仅当 a = b a=b a=b 时等式成立

即证。

这三种平均数各有利弊,但调和平均数受极端值影响较大,更适合评价不平衡数据的分类问题。

3、举例

已知三种模型得到的 P P P R R R 值如下,分别计算三种平均数

P P P R R R X ‾ \overline X X G G G F 1 F_1 F1
algorithm 10.50.40.450.450.44
algorithm 20.70.10.40.270.18
algorithm 30.021.00.510.140.04

可以看出算法3的 P P P 值非常小,我们认为此模型效果不好,但是利用算数平均数和几何平均数来衡量并不能表现出来,只有 F 1 F_1 F1 对极端值比较重视,能够感受到这种变化。

参考
[1]统计学
[2]机器学习基础-模型性能度量


http://chatgpt.dhexx.cn/article/TUAbqXuC.shtml

相关文章

精确度/召回率/F1值/Micro-F1和Macro-F1的理解

如下图所示,假设有若干张图片,其中12张是狗的图片其余是猫的图片.现在利用程序去识别狗的图片,结果在识别出的8张图片中有5张是狗的图片,3张是猫的图片(属于误报). 图中,…

混淆矩阵、精确率、召回率、F1值、ROC曲线、AUC曲线

假设一个分类器A,分类器A的作用是告诉你一张图片是不是汉堡,我们如果想知道这个分类器的效果到底好不好,如何做? 最简单的方法就是将手机里所有的图片都扔给分类器A看,让分类器告诉我们哪些是汉堡 我们无法直观的看到…

python实现计算精度、召回率和F1值

python实现计算精度、召回率和F1值 摘要:在深度学习的分类任务中,对模型的评估或测试时需要计算其在验证集或测试集上的预测精度(prediction/accuracy)、召回率(recall)和F1值。本文首先简要介绍如何计算精…

模型评价指标—F1值

最近空余时间在参加数字中国创新大赛,比赛规则是根据模型的F1值对参赛者进行排名。为了更深刻地理解这个指标,我最近对它做了一些梳理,现在把它分享给更多有需要的人图片。最近在参赛时也发现了一个问题,就是算法在训练集上完全拟…

精确率、召回率、F1 值、ROC、AUC等分类模型评价指标含义与作用详解

文章目录 摘要一、精确率、召回率、F函数、准确率和错误率1、定义2、区别与应用 二、ROC曲线、P-R曲线、AUC1、P-R曲线2、ROC曲线3、AUC 摘要 在涉及机器学习领域的分类问题时(尤其是衡量推荐系统性能时),经常会遇到诸如准确率、召回率、ROC…

机器学习F1值的概念

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、什么是F1-score二、计算过程1.首先定义以下几个概念:2.通过第一步的统计值计算每个类别下的precision和recall3. 通过第二步计算结果计算每个类别下…

【数学建模】分类问题的几种常见指标(一)——准确率、召回率、F1值

分类问题的几种常见指标(一)——错误率、精度、准确率、召回率、F1值 前言1 错误率与精度2 准确率与召回率2.1 混淆矩阵2.2 准确率(Precision)2.3 召回率(Recall) 3 F1值(F1-score)4…

准确率、精确率、召回率、F1值、ROC/AUC整理笔记

文章目录 前言 一、TP、TN、FP、FN概念二、准确率、精确率(精准率)、召回率、F1值1.准确率(Accuracy)2.精确率(Precision)查准率3.召回率(Recall)查全率4.F1值(H-mean值&…

准确率、精准率、召回率和F1值详解

专业术语的中英文对照表 英文名准确率Accuracy精准率Precise召回率RecallF1值F1 measure Precise和Recall是广泛应用在信息检索和统计学分类领域的两个度量值,用来评价结果的质量;F1 measure是综合Precise和Recall两个指标的评估指标,用于综…

matlab color选取(颜色对照表)

只看前面部分,后面的颜色不用看 参考链接:https://wenku.baidu.com/view/111e6c47773231126edb6f1aff00bed5b8f3734e.html

Matlab RGB 颜色对照表(0-1之间取值)

需要说明的是我并非此表的制作者,原链接如上,我也已将原作者信息一并截入图中,此举只是为了扩大此表传播度,所以连标题都没改。此前想找个如此全的对照表找了好久,是同门师妹发给我该链接才知道这张表,感谢…

matlab画图RGB调色

1.使用matlab画图时,怎样才能调出顺眼的颜色呢?反正我之前使用红、绿、蓝三种颜色画图时,真的辣眼睛。下面这图是我根据一篇论文上的图像调的颜色: 我也知道这并不好看,但是可以给各位提个醒、提个方向。 代码也奉上&…

让颜色对应数值,matlab colormap

#问 如何让自己画出的数值对应不同的颜色呢?换话句话说,如何用不同的颜色表示不同的数值呢? 就是让数值的范围对应颜色的范围。 matlab colormap ##标准色 hsv 色彩饱和值(以红色开始束) hot 从黑到红到黄到白 cool …

【Matlab】到底怎么自定义colorbar/colormap的颜色?

1.Introduction 最近在搜混淆矩阵的时候,发现别人做的图研究就是好看。于是乎开始探寻怎么改变图片colorbar的颜色,搜到后面发现其实是改变colormap的颜色,colorbar只是显示而已。 中间也走过不少坑,一把辛酸泪呀~ 2.Materials …

MATLAB | 有关数值矩阵、颜色图及颜色列表的技巧整理

这是一篇有关数值矩阵、颜色矩阵、颜色列表的技巧整合,会以随笔的形式想到哪写到哪,可能思绪会比较飘逸请大家见谅,本文大体分为以下几个部分: 数值矩阵用颜色显示从颜色矩阵提取颜色从颜色矩阵中提取数据颜色列表相关函数颜色测…

MATLAB颜色的使用(转)

http://blog.csdn.net/t673afa/archive/2009/09/29/4617106.aspx 如何使用、显示、修改和如何创建用户自己的颜色映象。然后,阐述在一个 图形窗口 中仿真多个颜色映象的技术或只使用颜色映象的一部分的技术。最后,讨论照明模型并提供例子。 颜色映象理解…

Linux更换挂载点

目的:/dev/vdb 原本挂载在/data目录下,现在将他挂载在/data0 目录下 步骤: 1、查看/dev/vdb 的挂载点 #df -h2、卸载 /data 挂载点 #umount /data #df -h3、创建新的挂载点,并挂载、查看 #mkdir /data0 #mount /dev/vdb /data0…

Linux各个挂载点及其分区介绍

本文介绍Linux常用分区挂载点常识以及桌面、服务器分区挂载点的推荐配置,当然这个配置是天缘自己写的,分区大小这个话题是仁者见仁智者见智,欢迎大家一起交流这个话题,比如WEB服务、邮件服务、下载服务等,我们一起交流…

Linux磁盘分区和挂载点

https://www.jianshu.com/p/cc2d19dcc204 在Linux系统中最多只有16个分区。Linux 规定了主分区(或者扩展分区)占用 1 至 16 号码中的前 4 个号码。Windows是用不同的盘符来区分并抽象不同的分区方便我们访问,那么Linux是如何区分不同的分区的…