模型的过拟合与欠拟合

article/2025/4/22 12:15:14

样本数据集:样本数据集总是表现为数据的内在规律(如:y=f(x))与随机噪声共同作用的结果。

训练集:训练集是用于训练模型的样本数据集合。我们总是希望通过训练集,找到真实数据的内在规律,同时又希望避开训练集数据的随机噪声对模型产生的影响。

泛化能力:模型通常由训练集数据训练获得,但我们希望的是模型在测试集上有较好的表现,也就是希望模型能够对其他训练集以外 的样本的目标值做出正确的预测和判断,这种能力称为模型的泛化能力。

机器学习的一般模式:我们通常可以将机器学习的过程看作求解形如 y = f ( x , w )的函数的过程,其中变换f是人为指定的映射形式,w向量代表函数中的未知参数(通常包含特征值的权重和偏置)。机器学习的过程就是,计算机通过人为设定的奖惩和规则,从训练集中学习到w向量的过程。

由上可知,我们面临的第一个问题是,设定怎样的变换f才能够使得模型最终能够较好地拟合数据的真实情况呢?

或者我们应该把问题再缩小一点,以多项式回归的拟合过程为例,我们用形如y = w0 + w1*x+ ... + wn*x^{n}的多项式企图拟合特征值x与目标值y之间的关系,那么多项式的次数n应该为多少才能较好地拟合真实数据呢?

模型的欠拟合:模型缺乏较好反应数据真实规律的能力。造成这样结果的通常原因是模型设置地不够复杂,因此缺乏拟合真实规律的能力。

模型的过拟合:模型过度拟合训练集,使得训练集的随机噪声对模型参数调整产生了较大影响,同样不能够较好地反应数据的真实规律。造成这样结果的通常原因,一是模型设置过于复杂,二是样本点的数量未远大于可调节的参数数量。

我们以刚才的多项式回归问题为例,如上图可以看到特征值与目标值明显为非线性的关系。

如果用n=1的线性模型就缺乏拟合数据真实规律的能力,如上图左侧所示;如果n过大就过度拟合了数据的随机性,如上图右侧所示。这两种情况下均不能对新的数据进行合理的预测。

因此,当n设置地过小,通常就出现了欠拟合现象;当n设置的过大,就会出现过拟合现象。仅当n处于一个较为适合地范围内,模型才能较好地贴合数据的真实规律。

以下规律是欠拟合和过拟合的常见特点:

1、欠拟合的模型在训练集和测试集上都表现出较大的根均方误差RMS(根均方公式:E_{RMS} = \sqrt{ 2E(w*)/N},其中E(w*)是二分之一的残差平方和,N为数据点数目),过拟合在训练集上表现出较小的RMS,在测试集上表现为较大RMS。

2、过拟合的模型参数通常很大,也就是说以一种较为剧烈的方式进行了拟合。因此通常采用添加带权重的正则化罚项的方式缓和过拟合问题,例如岭回归与lasso回归。

3、通常来说,训练数据集的规模越大,过拟合现象就能得到缓解。也就是说,通常数据集越大,我们采用的模型就应该设计地越复杂越灵活,待解决问题的复杂性与设计模型的复杂性成正相关。这一点在多层神经网络的层数和神经元个数的设计中也有体现。

4、数据集中点的数量应该远大于模型可调节参数的数量。

 


http://chatgpt.dhexx.cn/article/xwZKjSnS.shtml

相关文章

如何解决过拟合与欠拟合

如何解决过拟合与欠拟合 根据不同的坐标方式,欠拟合与过拟合图解不同。 1.横轴为训练样本数量,纵轴为误差 如上图所示,我们可以直观看出欠拟合和过拟合的区别: ​ 模型欠拟合:在训练集以及测试集上同时具有较高的误…

机器学习中的过拟合与欠拟合

目录 一、什么是过拟合与欠拟合二、原因及解决方法三、正则化类别四、拓展—原理 问题:训练数据训练的很好啊,误差也不大,为什么在测试集上面有 问题呢? 当算法在某个数据集当中出现这种情况,可能就出现了过拟合现象。…

机器学习之过拟合与欠拟合

1 机器学习中的误差 一般地,将学习器(机器学习模型)的实际预测输出与样本的真实输出之间的差异称为“误差”(error)。 统计学习的目的是使学到的模型不仅对已知数据而且对未知数据都能有很好的预测能力。不同的学习方法会给出不同的模型。当损失函数给定时&…

机器学习过拟合与欠拟合!

↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:胡联粤、张桐,Datawhale面经小组 Q1 如何理解高方差与低偏差? 模型的预测误差可以分解为三个部分: 偏差(bias), 方差(variance)…

机器学习:过拟合与欠拟合问题

本文首发于 AI柠檬博客,原文链接:机器学习:过拟合与欠拟合问题 | AI柠檬 过拟合(overfitting)与欠拟合(underfitting)是统计学中的一组现象。过拟合是在统计模型中,由于使用的参数过…

机器学习知识总结 —— 6. 什么是过拟合和欠拟合

文章目录 过拟合欠拟合泛化能力避免过拟合的一般方法从数据集上规避从训练模型上规避从训练过程上规避 作为从「统计学(Statistics)」跟「计算机科学(Computer Science)」交叉而诞生的新学科「机器学习(Machine Learni…

VGG16网络结构要点

学习BCNN的过程时遇到,VGG16的网络结构如下图示意: 13个卷积层(Convolutional Layer),分别用conv3-XXX表示3个全连接层(Fully connected Layer),分别用FC-XXXX表示5个池化层(Pool …

VGG-16网络结构解析

VGG,也叫做VGG-16网络。这个网络结构很有意思,相必实现这个网络的作者是有点强迫症,不然整个网络为什么能够如此的协调一致。基本上每一次的内容都大同小异,2层或3层卷积层,激活一下,池化一下,就…

VGGNet网络结构

深度神经网络一般由卷积部分和全连接部分构成。卷积部分一般包含卷积(可以有多个不同尺寸的核级联组成)、池化、Dropout等,其中Dropout层必须放在池化之后。全连接部分一般最多包含2到3个全连接,最后通过Softmax得到分类结果&…

VggNet网络结构详解

VggNet网络结构详解 #图像识别网络结构详解 一、概述 VGG在2014年由牛津大学著名研究组VGG (Visual Geometry Group) 提出,斩获该年ImageNet竞赛中 Localization Task (定位任务) 第一名 和 Classification Task (分类任务) 第二名。 二、网络详解 VGG16相比Al…

VGG11、VGG13、VGG16、VGG19网络结构图

VGG11、VGG13、VGG16、VGG19网络结构图 前言 前言 VGG网络采用重复堆叠的小卷积核替代大卷积核,在保证具有相同感受野的条件下,提升了网络的深度,从而提升网络特征提取的能力。 可以把VGG网络看成是数个vgg_block的堆叠,每个vgg_…

VGG网络结构详解与模型的搭建

首先贴出三个链接: 1. VGG网络结构详解视频 2. 使用pytorch搭建VGG并训练 3. 使用tensorflow搭建VGG并训练 VGG网络是在2014年由牛津大学著名研究组VGG (Visual Geometry Group) 提出,斩获该年ImageNet竞赛中 Localization Task (定位任务) 第一名 和…

【深度学习】VGG16网络结构复现 | pytorch |

文章目录 前言一、VGG16介绍二、VGG16网络复现——pytorch 前言 这篇文章按道理来说应该是很简单的,但是因为一个很小的bug,让我难受了一晚上,直到现在我也没找出原因。后面我会提到这个bug。 今天这篇文章主要用来手动搭建vgg16这个网路&am…

经典卷积神经网络---VGG16网络

VGG16网络结构及代码 下图为VGG网络结构图,最常用的就是表中的D结构,16层结构(13层卷积3层全连接层),卷积的stride为1,padding为1,maxpool的大小为2,stride为2(池化只改…

VGG16网络结构复现(Pytorch版)

VGG有6种子模型,分别是A、A-LRN、B、C、D、E,我们常看到的基本是D、E这两种模型,即VGG16,VGG19 为了方便阅读,并没有加上激活函数层 from torch import nn import torch from torchsummary import summaryclass VGG…

手动搭建的VGG16网络结构训练数据和使用ResNet50微调(迁移学习)训练数据对比(图像预测+前端页面显示)

文章目录 1.VGG16训练结果:2.微调ResNet50之后的训练结果:3.结果分析:4.实验效果:(1)VGG16模型预测的结果:(2)在ResNet50微调之后预测的效果: 5.相关代码和知…

卷积神经网络——vgg16网络及其python实现

1、介绍 VGG-16网络包括13个卷积层和3个全连接层,网络结构较LeNet-5等网络变得十分复杂,但同时也有不错的效果。VGG16有强大的拟合能力在当时取得了非常的效果,但同时VGG也有部分不足:1、巨大参数量导致训练时间过长&#xf…

VGG16系列III: 网络模型结构

目录 Part I: CNN的基础构件 一张图片如何作为输入? 什么是卷积 什么是Padding 什么是池化(pooling) 什么是Flatten 什么是全连接层 什么是Dropout 什么是激活函数 VGG16的整体架构图 Part II: VGG 网络架构 典型VGG网络结构 VGG 网络参数数量计算: P…

VGG网络结构(一)

刚开始接触深度学习、卷积神经网络的时候非常懵逼,不知道从何入手,我觉得应该有一个进阶的过程,也就是说,理应有一些基本概念作为奠基石,让你有底气去完全理解一个庞大的卷积神经网络: 本文思路&#xff1a…

VGG 网络结构

从图中可以看出VGG结构由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用max-pooling(最大池化)分开,所有隐层的激活单元都采用ReLU函数。VGG最大的贡献就是证明了卷积神经网络的深度增加和小卷积核的使用对网络的最终…