验证集精确度和损失同时上升

article/2025/9/11 23:57:34

目录

  • 1. 实验结果
  • 2. 分析

1. 实验结果

  下图中val_acc,val_loss分别表示验证集精确度和损失;train_acc,train_loss分别表示训练集精确度和损失。验证集精确度一直上升,但是损失在第六个epoch后也开始上升,如何解释?
在这里插入图片描述在这里插入图片描述

2. 分析

  在N标签分类任务中,输出是一个N维的向量,向量中每个位置代表某类标签,其值代表属于此类标签的概率值。我们取概率最大值的索引所对应的标签作为最终预测标签,所以最大概率其相对值更重要,90%的概率和50%的概率是等价的,只要它是最大概率即可,但是90%所对应的损失要小于50%对应的损失。因此只要正确类别的预测概率最大,它就可以在val-loss增加时仍然保持比较平稳的状态。

  下面通过一个例子说明:

  假设现在有2个类别的数据集,类别分别是dog和horse,对于现在的一个样本,其真实类别是horse,也就是其真实值one-hot为[0, 1],对于下面2种情况:
①其预测softmax值为[0.1, 0.9],则对于这个例子的交叉熵值计算为:
− ( 0 ∗ l n 0.1 + 1 ∗ l n 0.9 ) ≈ 0.105 -(0*ln0.1+1*ln0.9) ≈ 0.105 (0ln0.1+1ln0.9)0.105
②其预测softmax值为[0.4, 0.6],则对于这个例子的交叉熵值计算为:
− ( 0 ∗ l n 0.4 + 1 ∗ l n 0.6 ) ≈ 0.511 -(0*ln0.4+1*ln0.6) ≈0.511 (0ln0.4+1ln0.6)0.511
  也就是说,虽然在上述两种情况下,预测值都为horse,即其accuracy是一样的,但是其loss是增加的。这种情况下就会出现val-loss不断增加,但是val-accuracy平稳不变的情况。
同理,在若干个样本的加和val-loss中,可能出现val-accuracy缓慢上升,val-loss也上升的情况,这种情况也属于过拟合问题,在这种情况下,可能预测softmax值稍微发现一点点的变化,使得accuracy上升,但是因为有其他样本的loss增加的较多,所以即使对于当前这样样本来说,acc增加,loss减少,但是对于整体样本的loss和来说,loss增加,造成整体情况是acc增加,loss也在增加。

  实验表明,在数据量不是很大的情况下,的确会出现上述问题,但是如果数据量足够大,最终趋于的平稳情况是loss增加,acc会降低。这也就引出了为什么在训练网络的衡量指标中,loss比accuracy更常用,总结如下:
  (1) loss函数是可微的,而accuracy不是可微的,在网络模型反向传播过程中,需要可微的目标函数。
  (2) 在分类任务中,使用accuracy可以,但是在回归任务中,accuracy便不再可用,只能使用loss
  (3) 损失函数可以有多种优化方法,如牛顿法、极大似然估计等

参考:
https://blog.csdn.net/quiet_girl/article/details/86138489


http://chatgpt.dhexx.cn/article/AtCunAkS.shtml

相关文章

JavaScript超大或超小数值精确度丢失解决方案

情景一 接口字段,Number类型数据失真,解决方法可直接让服务端把字段类型改成String类型即可。 情景二 某些特殊场景,需要保留小数点后9位(及其以上),直接调用Number对象自带的toFixed()函数,会出现小数点后数据失真…

关于JavaScript精确度问题

一、js精确度的安全范围是 -2^53 至 2^53 一旦超过这个范围则无法精确表示 1.解决方法 使用第三方包 JSON-Bigint JSONbig.parse() //转换出来的是一个BigNubmer对象 若要使用则用toString()方法 JSONbig.stringify() 2.当axios获取响应数据时自动会将数据JSON.parse()解析为…

【机器学习】准确率、精确度、召回率和 F1 定义

一、说明 数据科学家选择目标变量后 - 例如他们希望预测电子表格中的“列”,并完成了转换数据和构建模型的先决条件,最后步骤之一是评估模型的性能。 二、混淆矩阵的模型 2.1 混淆矩阵 选择性能指标通常取决于要解决的业务问题。假设您的数据集中有 10…

Python计算分类问题的评价指标(准确率、精确度、召回率和F1值,Kappa指标)

机器学习的分类问题常用评论指标有:准确率、精确度、召回率和F1值,还有kappa指标 。 每次调包去找他们的计算代码很麻烦,所以这里一次性定义一个函数,直接计算所有的评价指标。 每次输入预测值和真实值就可以得到上面的指标值&a…

batch_size对精确度和损失的影响

1 问题 在深度学习的学习过程中,模型性能对batchsize虽然没有学习率那么敏感,但是在进一步提升模型性能时,batch_size就会成为一个非常关键的参数。 batch_size对精度和损失的影响研究。 batch_size [,32,64,128,256] 不同batch_…

准度、精度傻傻分不清?

[导读] 做电子产品,常常遇到测量。此时就难免会关注到精度、准度等概念,遇到不少朋友对这两个概念不清楚,今天就来分享一下这两个概念。最近很忙,更的不及时,实在抱歉。也感谢大家不离不弃!对于更文分享这件…

机器学习笔记--classification_report精确度/召回率/F1值

classification_report简介 sklearn中的classification_report函数用于显示主要分类指标的文本报告.在报告中显示每个类的精确度,召回率,F1值等信息。 主要参数: y_true:1维数组,或标签指示器数组/稀疏矩阵&#xf…

YOLOv5~目标检测模型精确度

还是yolo5的基础啊~~ 一些关于目标检测模型的评估指标:IOU、TP&FP&FN&TN、mAP等,并列举了目标检测中的mAP计算。 指标评估(重要的一些定义) IOU 也称重叠度表示计算预测回归框和真实回归框的交并比,计算公式如下: TP&FP&FN&…

睿智的目标检测20——利用mAP计算目标检测精确度

睿智的目标检测20——利用mAP计算目标检测精确度 学习前言GITHUB代码下载知识储备1、IOU的概念2、TP TN FP FN的概念3、precision(精确度)和recall(召回率)4、概念举例5、单个指标的局限性 什么是AP绘制mAP 学习前言 好多人都想算…

误差与精度

机械专业用于教授学生误差与精度概念的课程叫做《公差与测量》或者叫做《机械精度设计》,而公差或者精度的本质含义就是误差的大小,公差越小,误差越小,精度越高。所以机械专业这门课其本质教授的还是误差理论。 在学校并没有好好学…

层次分析法 AHP

层次分析法(Analytic Hierarchy Process,简称 AHP)是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。它是美国运筹学家 T. L. Saaty 教授于上世纪 70 年代初期提出的一种简便、灵活而…

权重计算方法一:层次分析法(AHP)

目录 1.层次分析法原理介绍 2.层次分析法建模步骤 3.案例分析 3.1 题目简述 3.2 确定评价指标,建立层次关系 3.3 构造判断矩阵 3.3.1 标度定义 3.3.2 构造判断矩阵 3.4 一致性检验 3.5 层次总排序 4.代码实现 1.层次分析法原理介绍 关于层次分析法的具体原…

【数学建模】层次分析法(AHP)

层次分析法 文章目录 层次分析法用途一、模型介绍一道典型例题1.建立层次结构2.对于同一层次的个元素关于上一层次中的某一准则的重要性进行两两比较,构造两两比较矩阵(判断矩阵)。2.1 O-C矩阵(确定指标的权重)2.2 准则…

什么是AHP 层次分析法?

AHP层次分析法(The analytic hierarchy process)是一种解决多目标复杂问题的定性和定量相结合进行计算决策权重的研究方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标之间能否实现的标准之间的相对重要程度,并合理地给出每个决策…

[评价体系] 2、层次分析法AHP原理、例题

目录 1 基本介绍 2 建立步骤 2.1 建立递阶式层次结构模型 2.2 构造比较判断矩阵 2.3 层次单排序及一致性检验 2.4 层次总排序及其一致性检验 2.5 数据加权 3 案例:某学科创新能力评价指标体系 3.1 构建评价指标体系 3.2 构造判断矩阵及一致性检验 3.3 …

数学建模方法——层次分析法(AHP)

目录: 层次分析法简介层次分析法基本原理构造判断矩阵一致性检验一致性检验通过的判断矩阵求权重 4.1 算数平均法求权重 4.2 几何平均法求权重 4.3 特征值法求权重总结 0. 层次分析法简介 层次分析法(Analytic Hierarchy Process,简称AHP&…

层次分析法(AHP)算法简介

一、模型介绍 层次分析法(AHP)是美国运筹学家萨蒂于上世纪70年代初,为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分…

层次分析法(AHP)原理_例题应用及代码

层次分析法(AHP)原理应用及代码 1.AHP算法步骤2.算法举例第一步:建立递阶层次图第二步:建立判断矩阵计算五个指标的判断矩阵计算三个方案相对于某一指标的权重第三步:进行一致性检验一致性检验的步骤第一步:计算一致性指标 C I CI CI第二步:查找对应的平均随机一致性指标…

小话层次分析法(AHP)

在目标决策领域,有的决策数据信息是量化的,如一个项目的未来收益、消耗成本等,通过对各种信息进行计算可以做出较好的决策;但有的决策数据信息并不全是数字化的,如项目信息为“这个收益更好”、“这个成本更高”这样的…

清风数学建模学习笔记——层次分析法(AHP)

层次分析法 层次分析法(analytic hierarchy process),简称AHP。是建模比赛中比较基础的模型之一,其主要解决评价类的问题。如选择哪种方案最好,哪位员工表现最好等。 它是一个较为 主观 的评价方法,其在赋权…