评测指标(metrics)

article/2025/8/25 17:00:54

评测指标(metrics)

metric主要用来评测机器学习模型的好坏程度,不同的任务应该选择不同的评价指标, 分类,回归和排序问题应该选择不同的评价函数. 不同的问题应该不同对待,即使都是 分类问题也不应该唯评价函数论,不同问题不同分析.

回归(Regression)

  1. 均方误差(MSE)

(1) l ( y , y ^ ) = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 l(y, \hat{y})=\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2 \tag{1} l(y,y^)=n1i=1n(yiy^i)2(1)

  1. 均方根误差(RMSE)

(2) l ( y , y ^ ) = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 l(y, \hat{y})=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2} \tag{2} l(y,y^)=n1i=1n(yiy^i)2 (2)

  1. 平均绝对误差(MAE)

(3) l ( y , y ^ ) = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ l(y, \hat{y})=\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y}_i| \tag{3} l(y,y^)=n1i=1nyiy^i(3)

  1. R Squared

(4) R 2 = 1 − ( ∑ i = 1 n ( y i − y ^ i ) 2 ) / n ( ∑ i = 1 n ( y i − y ˉ i ) 2 ) / n R^2=1-\frac{(\sum_{i=1}^{n}(y_i-\hat{y}i)^2)/n}{(\sum{i=1}^{n}(y_i-\bar{y}_i)^2)/n} \tag{4} R2=1(i=1n(yiyˉi)2)/n(i=1n(yiy^i)2)/n(4)
其中: y ^ \hat{y} y^是预测值, y y y是真实值, n n n是样本个数, y ˉ \bar{y} yˉ y y y的平均值.

分类(Classification)

  1. 准确率和错误率

(5) a c c ( y , y ^ ) = 1 n ∑ i = 1 n y i = y i ^ acc(y,\hat{y})=\frac{1}{n}\sum_{i=1}^{n}y_i=\hat{y_i} \tag{5} acc(y,y^)=n1i=1nyi=yi^(5)
(6) e r r o r ( y , y ^ ) = 1 − a c c ( y , y ^ ) error(y, \hat{y})=1-acc(y,\hat{y}) \tag{6} error(y,y^)=1acc(y,y^)(6)

  1. 混淆矩阵,精准率和召回率

对于二分类问题,可将样例根据其真是类别与学习器预测类别的组合划分为真正例(true positive, TP),假正例(false positive, FP),真反例(ture negative, TN),假反例(false negative, FN), 则有:TP+FP+TN+FN=样例总数. 分类结果的混淆矩阵(confusion matrix)如下:
在这里插入图片描述
则有精准率P和召回率R定义如下: (7) P = T P T P + F P P=\frac{TP}{TP+FP} \tag{7} P=TP+FPTP(7)
(8) R = T P T P + F N R=\frac{TP}{TP+FN} \tag{8} R=TP+FNTP(8)
则F1值定义如下: (9) 1 F 1 = 1 2 ⋅ ( 1 P + 1 R ) \frac{1}{F_1}=\frac{1}{2} \cdot (\frac{1}{P}+\frac{1}{R}) \tag{9} F11=21(P1+R1)(9)
(10) F 1 = 2 P R P + R F_1=\frac{2PR}{P+R} \tag{10} F1=P+R2PR(10)

  1. ROC和AUC

ROC全称是"受试者工作特征"(Receiver Operating Characteristic)曲线. 根据学习器的预测结果堆样例进行排序,按此顺序逐个把样本作为正例进行预测,每次计算出两个重要的值,分别以他们作为横纵坐标作图,就得到"ROC曲线". 其中ROC曲线的横轴是"假正例率"(False Positive Rate, FPR), 纵轴是"真正例率"(True Positive Rate, TPR), 注意这里不是上文提高的P和R. 其中:
(11) T P R = T P T P + F N TPR=\frac{TP}{TP+FN} \tag{11} TPR=TP+FNTP(11) (12) F P R = F P T N + F P FPR=\frac{FP}{TN+FP} \tag{12} FPR=TN+FPFP(12)

现实使用中,一般使用有限个测试样例绘制ROC曲线,此时需要有有限个(真正例率,假正例率)坐标对. 绘图过程如下:

  1. 给定 m + m^+ m+个正例和 m − m^- m个反例,根据学习器预测结果对样例进行排序,然后将分类阈值设为最大,此时真正例率和假正例率都为0,坐标在(0,0)处,标记一个点.
  2. 将分类阈值依次设为每个样本的预测值,即依次将每个样本划分为正例.
  3. 假设前一个坐标点是(x,y),若当前为真正例,则对应坐标为 ( x , y + 1 m + ) (x,y+\frac{1}{m^+}) (x,y+m+1), 若是假正例,则对应坐标为 ( x + 1 m − , y ) (x+\frac{1}{m^-}, y) (x+m1,y)
    线段连接相邻的点.

理想的图和现实的图对比如下图(其中对角线对应于"随机猜测"模型):
在这里插入图片描述
为了进行比较,较为合理的判别依据是ROC曲线下面的面积,即AUC(Area Under ROC Curve). 从上图看出,AUC可估算为:
(13) A U C = 1 2 ∑ i = 1 m − 1 ( x i + 1 − x i ) ⋅ ( y i + y i + 1 ) AUC=\frac{1}{2}\sum_{i=1}^{m-1}(x_{i+1}-x_i)\cdot(y_i+y_{i+1}) \tag{13} AUC=21i=1m1(xi+1xi)(yi+yi+1)(13)
AUC考虑是样本排序的质量,因此它和排序误差有紧密联系.给定 m + m^+ m+个正例和 m − m^- m个负例,另 D + D^+ D+ D − D^- D分别表示正和反例的集合,则排序损失定义为: (14) l r a n k = 1 m + m − ∑ x + ∈ D + ∑ x − ∈ D − ( I ( f ( x + ) &lt; f ( x − ) ) + 1 2 I ( f ( x + ) = f ( x − ) ) ) l_{rank}=\frac{1}{m^+m^-}\sum_{x^+ \in D^+}\sum_{x^- \in D^-}(I(f(x^+)&lt;f(x^-))+\frac{1}{2}I(f(x^+)=f(x^-))) \tag{14} lrank=m+m1x+D+xD(I(f(x+)<f(x))+21I(f(x+)=f(x)))(14)
即考虑每一对正反例,若正例的预测值小于反例,则记一个"罚分", 若相等,则记0.5个"罚分". 其实 l r a n k l_{rank} lrank对应的是ROC曲线之上的面积,则有:
(15) A U C = 1 − l r a n k AUC=1-l_{rank} \tag{15} AUC=1lrank(15)

  1. CTR和CVR
  1. CTR
    CTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Show content). (16) c t r = 点 击 次 数 展 示 量 ctr=\frac{点击次数}{展示量} \tag{16} ctr= (16)
  2. CVR
    CVR (Conversion Rate): 转化率。是一个衡量CPA广告效果的指标,简言之就是用户点击广告到成为一个有效激活或者注册甚至付费用户的转化率. (17) c v r = 点 击 量 转 化 量 cvr=\frac{点击量}{转化量} \tag{17} cvr= (17)

参考

  1. 周志华 西瓜书
  2. 李航 统计学习方法
  3. https://baike.baidu.com/item/CVR/20215345
  4. https://baike.baidu.com/item/CTR/10653699?fr=aladdin
  5. https://www.cnblogs.com/shenxiaolin/p/9309749.html

http://chatgpt.dhexx.cn/article/Waj5kLQp.shtml

相关文章

MeasureSpec学习—对Integer.MAX_VALUE 2的认识

在自定义View和ViewGroup的时候&#xff0c;我们经常会遇到int型的 MeasureSpec 来表示一个组件的大小&#xff0c;这个变量里面不仅有组件的尺寸大小&#xff0c;还有大小的模式。 这个大小的模式&#xff0c;有点难以理解。在系统中组件的大小模式有三种&#xff1a; 1.精确…

理解Android中的MeasureSpec

文章收藏的好句子&#xff1a;永远要相信美好的事情即将发生。 ps&#xff1a;本文源码是基于 Android Api 31 来分析的 目录 1、MeasureSpec 1、1 SpecMode 1、2 MeasureSpec 的 int 值和 LayoutParams 的对应关系 1、MeasureSpec 我们在 Android 手机上看到的界面&#xff0c…

android Measurespec测量模式

MeasureSpecs 类 1、是一个32位的二进制数&#xff0c;由模式&#xff08;mode&#xff09;和大小&#xff08;size&#xff09;组成&#xff0c; 2、其中&#xff1a;32和31位代表测量模式&#xff08;mode&#xff09;、后30位代表测量大小&#xff08;size&#xff09; 3、…

MeasureSpec源码解读

文章目录 MeasureSpec的源码MeasureSpec与LayoutParams 今天来讲讲MeasureSpec吧。因为他与View的测量流程相关性很大&#xff0c;只有正确的理解了MeasureSpec的工作原理&#xff0c;我们才能更好的自定义View。那么MeasureSpec它的作用是什么呢&#xff1f;一般来说&#xff…

理解 MeasureSpec

在开始本篇文章之前&#xff0c;我们先看一段代码&#xff1a; Overrideprotected void onMeasure(int widthMeasureSpec, int heightMeasureSpec) {int expendSpec MeasureSpec.makeMeasureSpec(Integer.MAX_VALUE >> 2, MeasureSpec.AT_MOST);super.onMeasure(widthMe…

对MeasureSpec.makeMeasureSpec(Integer.MAX_VALUE 2, MeasureSpec.AT_MOST)的一点理解

之前 遇到ScrollView中嵌入ListView&#xff0c;GridView冲突的解决&#xff08;让ListView全显示出来&#xff09; 链接 网上查找资料&#xff0c;代码大致如下&#xff1a; import android.content.Context; import android.util.AttributeSet; import android.widget.ListV…

View的基本概念与MeasureSpec

1.基本概念 View的绘制是由measuer、layout、draw三个过程才能完整的绘制一个View&#xff0c;其中measure是测量View的宽、高&#xff0c;layout是为了确认View在父容器所在的位置&#xff0c;draw是负责在屏幕上将View绘制出来。View的绘制流程是从ViewRoot的performTraversa…

Android之:了解MeasureSpec.makeMeasureSpec(Integer.MAX_VALUE 2,MeasureSpec.AT_MOST)

在自定义View和ViewGroup的时候&#xff0c;我们经常会遇到int型的 MeasureSpec 来表示一个组件的大小&#xff0c;这个变量里面不仅有组件的尺寸大小&#xff0c;还有大小的模式。 这个大小的模式&#xff0c;有点难以理解。在系统中组件的大小模式有三种&#xff1a; 1.精确…

Android开发 MeasureSpec介绍

搬家后的博客链接: IT客栈 www.itkezhan.org 在自定义View和ViewGroup的时候&#xff0c;我们经常会遇到int型的MeasureSpec来表示一个组件的大小&#xff0c;这个变量里面不仅有组件的尺寸大小&#xff0c;还有大小的模式。 这个大小的模式&#xff0c;有点难以理解。在系统中…

Android-测量规格(MeasureSpec)

目录 一、简介二、组成三、具体使用 一、简介 二、组成 测量规格(MeasureSpec)是由测量模式(mode)和测量大小(size)组成&#xff0c;共32位(int类型)&#xff0c;其中&#xff1a; 测量模式(mode)&#xff1a;占测量规格(MeasureSpec)的高2位&#xff1b;测量大小(size)&…

MeasureSpec学习 - 转

在自定义View和ViewGroup的时候&#xff0c;我们经常会遇到int型的 MeasureSpec 来表示一个组件的大小&#xff0c;这个变量里面不仅有组件的尺寸大小&#xff0c;还有大小的模式。 这个大小的模式&#xff0c;有点难以理解。在系统中组件的大小模式有三种&#xff1a; 1.精确…

MeasureSpec介绍

在自定义View和ViewGroup的时候&#xff0c;我们经常会遇到int型的MeasureSpec来表示一个组件的大小&#xff0c;这个变量里面不仅有组件的尺寸大小&#xff0c;还有大小的模式。 这个大小的模式&#xff0c;有点难以理解。在系统中组件的大小模式有三种&#xff1a; 1.精确模式…

Android 中MeasureSpec的创建规则

概述 在Android中&#xff0c;View的onMeasure()方法用来对控件进行测量&#xff0c;确定控件的宽高。该方法的两个参数widthMeasureSpec和heightMeasureSpec由父View计算后传入子view的measure()方法&#xff0c;再由子view的measure()方法传入onMeasure()方法&#xff0c;本…

关于google浏览器打不开网页问题之容易被忽略的点

其实google浏览器打不开 网页&#xff0c;原因网上有好多种&#xff0c;包括什么关闭防火墙、取消高级设置LAN单选框等&#xff0c;我也都试了&#xff0c;搞到最后要崩溃了&#xff0c;后来无意中&#xff0c;我输入一个http://baidu.com然后enter管用了&#xff0c;能打开页面…

谷歌浏览器打不开网页

今天起来发现谷歌浏览器和IE都打不开网页了&#xff0c;估计是我电脑代理又被修改了 在谷歌浏览器的设置--> 高级 --> 打开代理设置中 取消勾选即可修复问题。

关于谷歌浏览器打不开的解决方法

关于谷歌浏览器打不开的解决方法 打开Google,搜索&#xff0c;出现下面的问题&#xff0c;怎么解决呢&#xff0c;下面两种方法提供参考。 打开Google,首页显示输入网址&#xff0c;我们可以输入任意一个网址&#xff0c;例如www.baidu.com,然后就可以搜索了。 打开选项-设置…

谷歌浏览器(chrome)无法正常打开网页的解决办法

在网上看到许多新手想使用谷歌浏览器但是下载安装之后却无法打开网页 分析原因如下&#xff1a; 一般都是因为谷歌浏览器默认的地址栏搜索引擎为goole&#xff0c;由于goole属于国外的网站&#xff0c;我们访问是需要fan qiang才能访问的&#xff0c;所以无法打开网页。所以我…

chrome双击突然打不开的解决办法

这个也是没有想到&#xff0c;浪费了我挺长时间。我电脑的chrome突然打不开了&#xff0c;打不开的意思是双击了之后没有反应&#xff0c;但是其实是有打开进程的&#xff0c;这个就很坑。 网上搜了很多&#xff0c;什么把进程给杀掉的&#xff0c;重启电脑的&#xff0c;重装c…

Outlook 突然打不开

打开电脑正准备上班然后outlook崩了&#xff0c;报错建议我重装软件。。问题是现在用的都是365全家桶&#xff0c;也没办法单独重装一个outlook。盲试了一把repair居然修好了..再后来就经常用到它T_T..&#xff08;不是什么好事&#xff09; 首先有几种临时解决方法。 如果时间…

谷歌浏览器任何页面都打不开连设置也不能打开

谷歌浏览器任何页面都打不开 设置不能打开 找到谷歌右击选择属性 点击目标在最后加上 -no-sandbox即可解决 一定记得在 -no-sandbox前加上空格