量纲与无量纲、标准化、归一化、正则化【能够帮助梯度下降中学习进度收敛的更快、提升模型的收敛速度提升模型的精度、防止模型过拟合,提高模型的泛化能力】

article/2025/9/15 21:25:45

目录

1 量纲与无量纲

1.1 量纲

1.2 无量纲

2 标准化

3 归一化

归一化的好处

4 正则化

5 总结


1 量纲与无量纲

1.1 量纲

物理量的大小与单位有关。就比如1块钱和1分钱,就是两个不同的量纲,因为度量的单位不同了。

1.2 无量纲

物理量大小与单位无关。例如角度、增益、两个长度之比等

2 标准化

梯度下降是受益于特征缩放的算法之一。有一种特征缩放的方法叫标准化标准化使得数据呈现正态分布,能够帮助梯度下降中学习进度收敛的更快
标准化移动特征的均值(期望),使得特征均值(期望)为0,每个特征的标准差为1。
标准化

为何标准化能够帮助梯度下降学习是因为优化器需要经历一些步骤才能找到好的或最优的方案(全局最小代价),如图所示,这表示了一个二分类问题中,关于两个权重的代价曲线函数。
而我们再来看看图,图的正中心代表着全局最优的代价(代价最小),而左边的图w2方向比较窄,w1方向又比较宽,那么在梯度下降的过程中,在w2方向梯度会很小,所以会一直寻找最优的点,那么带来了迭代次数变多的后果,降低了效率。
而当对其标准化后,变为了右图这种0均值,1标准差的情况,那么在梯度下降的过程中,不会因为某个方向梯度过小而带来更多的迭代。

3 归一化

归一化(normalization)和标准化(standardization)区别不是很大,都是特征缩放(feature scale)的方式。

有的资料中说的,归一化是把数据压缩到[0,1],把量纲转为无量纲的过程,方便计算、比较等
我们有两种普通的方法来将不同的特征带到同样的范围:归一化(normalization)和标准化(standardization)。这两个术语在不同领域的使用比较松散,通常需要靠上下文来判断它们的含义。普遍情况下,归一化指的是将特征缩放到[0,1]这个区间,这是一个“min-max scaling”的特殊栗子。
而对于不同特征列向量来说,常用的归一化方法:min-max scaling公式如下:


 

归一化还有一点,就是说归到[ 0 , 1 ]区间后,并不会改变原本的数值大小排序关系。就比如上面的栗子,[ 1 , 5 , 3 ]的大小关系为( 1 , 3 , 2 ),归一化为[ 0 , 1 , 0.5 ] 后的大小关系依旧为( 1 , 3 , 2 ),并没有发生变化。

归一化的好处

  1. 提升模型的收敛速度
  2. 提升模型的精度

那么关于归一化、标准化的本质区别就是说:归一化是将特征缩放到[ 0 , 1 ] 区间标准化是把特征缩放到均值为0,标准差为1

4 正则化

正则化(regularization)是与标准化还有归一化完全不同的东西。正则化相当于是个惩罚项,用于惩罚那些训练的太好的特征/参数,防止模型过拟合,提高模型的泛化能力

正则化就是用来处理collinearity的,这个collinearity指的是与特征高度相关,清理掉数据的噪声,最终阻止过拟合。而正则化实际上就是引入一个额外的信息(偏置)来惩罚极端的参数(权重)值。
过拟合

我们看到图三这个曲线非线性拟合的太完美了,那么就造成了过拟合,造成的原因是因为特征过多,训练的太好了,而这个特征过多,我个人认为就对应了上面英文中的collinearity (high correlation among features)。

我们再来分析图二和图三的公式,多了的特征是x^3 和x^4,为何多了这两个就造成了图三这样的车祸现场(因为拟合的太好了,导致泛化性能很差,当有新的特征来的时候就哦豁了)?大家不妨回忆下泰勒级数,就是用多项式逼近任意一个曲线,这里也是同样的道理。那么我们要怎样解决过拟合?我们有以下两种方法:

1.减少特征个数(特征约减):
    手工保留部分特征(你觉得你能做到么?反正我觉得我做不到)
    模型选择算法(PCA,SVD,卡方分布)
2.正则化:保留所有特征,惩罚系数θ,使之接近于0,系数小,贡献就小。所以也就对应了书本上的惩罚极端参数值。

正则化通常采用L2正则化,公式如下:

 

其中λ 称作正则化项。这里1/2是方便求导。

关于为何通常采用第二范数而非第一范数,我个人认为有如下两个理由:

  1. 计算机中计算平方比计算绝对值简单;
  2. 第二范数是光滑且可求导的,但是第一范数至少在0这个点是不可导的。
     

5 总结

量纲与无量纲的区别就是:物理量是否与单位有关。
标准化与归一化没有显著的区别,具体是谁要依据上下文确定。归一化是把特征缩放到[ 0 , 1 ],标准化是把特征缩放到均值为0,标准差为1。
正则化是与标准化和归一化完全不同的东西,是用于惩罚训练的太好的参数,防止模型过拟合,提高模型的泛化能力。

原文:机器学习学习笔记(3)——量纲与无量纲,标准化、归一化、正则化_LiQZ的博客-CSDN博客_量纲归一化


http://chatgpt.dhexx.cn/article/mq9qRG4k.shtml

相关文章

数据预处理----数据无量纲化(归一化和标准化)

文章目录 概述数据挖掘的五大步骤skleran中的数据处理和特征工程 数据预处理Preprocessing数据无量纲化数据归一化---MinMaxScaler示例 数据标准化----StandardScaler示例 MinMaxScaler和StandardScaler应该选哪个 概述 数据挖掘的五大步骤 数据获取数据预处理 数据预处理是从…

数学分析模型(一):数据的无量纲处理方法及示例(附完整代码)

数据的无量纲处理方法及示例(附完整代码) (1)极值化方法(2)标准化方法(3)均值化方法示例要求建模步骤程序结果备注在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得…

数据无量纲化

数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向…

量纲化处理汇总

在实际研究中,不同的变量单位不同,数值差异极大。例如100g和1m等。 因此有时需要对数据进行去量纲,所谓的去量纲就是‘去掉’单位对数值的影响。但是量纲化有很多种方式,但具体应该使用哪一种方式,并没有固定的标准&am…

数据预处理--无量纲化

1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。 2.无量纲化方法 无量纲化方法有很多,但是从几何角度来…

多指标综合评价中指标正向化和无量纲化方法的选择

摘要:本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例…

量纲与无量纲,标准化、归一化、正则化

量纲与无量纲,标准化、归一化、正则化 1 量纲与无量纲1.1 量纲1.2 无量纲 2 标准化3 归一化4 正则化5 总结 1 量纲与无量纲 1.1 量纲 量纲我觉得最重要的一句话是:物理量的大小与单位有关。 从这句话我们来思考下最核心的两个单词:大小、单…

数据预处理之数据无量纲化(标准化/归一化)

在进行特征选择之前,一般会先进行数据无量纲化处理,这样,表征不同属性(单位不同)的各特征之间才有可比性,如1cm 与 0.1kg 你怎么比?无量纲处理方法很多,使用不同的方法,对…

无量纲化

参考博客:https://www.zhihu.com/question/29316149 1,无量纲化使不同规格的数据转换到同一规格。 2,常见的无量纲化方法有标准化和区间缩放法。 2.1**标准化**的前提是特征值服从正态分布,标准化后,其转换成标准正态分布。   标准化需要计算特征的…

什么是无量纲化

首先来了解什么是量纲? 量纲和单位的区别,长度,时间,质量等都叫做量纲,而米,千米,秒,分钟,等都是单位, 国际单位制规定了七个基本量纲单位,这七个…

常用的数据无量纲化方法

常用的数据无量纲方法 常用的数据无量纲方法都有什么?1.min-max归一化2.z-score标准化 常用的数据无量纲方法都有什么? 1.min-max归一化 该方法是对原始数据进行线性变换,将其映射到[0,1]之间([-1,1]之间也行)。 d…

数据预处理——无量纲化处理

数据预处理——无量纲化处理 1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。 2.无量纲化方法 无量纲化方法有很…

几种指标无量纲化的方法

统计指标的无量纲化就是将统计指标的实际值转化为评价值。由于统计指标的性质不同,相应地,统计指标实际值转化为评价值的方法也就不同。 一、线性无量纲化方法 如果无量纲化的指标评价值与指标的实际值之间是呈现线性关系的,这种无量纲化方…

Latex公式换行编写

latex在写公式时往往会遇到长公式或者连续等于的情况,这时可以选择公式换行操作: \begin{equation}\begin{aligned}a & bc\\& cb\end{aligned} \end{equation} 得到如下的效果: 其中&是用于标注需要对齐的位置,例如…

Latex 多行公式换行对齐

\begin{equation} \begin{split} x&abc\\ &de\\ &fg \end{split} \end{equation} 效果:

LaTex排版技巧:[15]公式太长如何换行

当我们输入的公式较长时,最容易想到的方法是,在会出现越界的情况,使用强制换行\\,但是这种方法在公式中行不通。 通常,我们行间公式的换行可使用split 环境来实现。如 \[ \begin{split} x & \sqrt {1-y^2}\\ x &am…

LaTex常用技巧5:公式太长换行并加大括号

使用LaTex做笔记的时候发现公式太长,一行会超出页面,于是想到换行。 原来的代码,这里使用了包bm,测试的时候前面请使用\usepackage{bm}。 \begin{equation}_{i}^{G} {\bm{a}}\begin{cases} _{i}^{i-1}\ddot{\bm{p}}, &i1\\_…

Latex 公式太长,换行等号对其

首先一定要插入两个包: \usepackage{amsmath} \usepackage{amssymb} 如果不插入包的话,每次运行到aligned就会报错 然后文章中可如下编译公式: \begin{equation}\label{1} \begin{aligned} a & b c \\ & d e \end{aligned}…

latex如何实现单元格内文字的换行

问题描述 使用latex绘制表格时,有时候会遇到单元格的文字过长,显得很拥挤,适当的换行可以使整体效果更加美观,比如: 源代码为: \resizebox{\textwidth}{!}{\begin{tabular}{cccccccc}\toprule\textbf{Nam…

Latex公式排版(编号、换行、括号内换行、对齐)

最近写论文刚上手了Latex,因为有模板,所以用起来还是很方便的。 但是在实际使用中,由于论文是双栏的,因此比较长的公式在排版时会比较困难。下面对Latex中的公式排版方法做一些记录。 公式的编写方法在此不再赘述。可以选择网页版…