量纲与无量纲，标准化、归一化、正则化

article/2025/9/15 21:27:58

量纲与无量纲，标准化、归一化、正则化

1 量纲与无量纲
- 1.1 量纲
- 1.2 无量纲
2 标准化
3 归一化
4 正则化
5 总结

1 量纲与无量纲

1.1 量纲

量纲我觉得最重要的一句话是：物理量的大小与单位有关。

从这句话我们来思考下最核心的两个单词：大小、单位。就是说量纲是有两部分组成：数、单位。就比如1块钱和1分钱，就是两个不同的量纲，因为度量的单位不同了。

1.2 无量纲

结合上面的内容来说，那么无量纲就是：物理量大小与单位无关。

那么我们来考虑下，哪些内容是无量纲的。首先标量肯定是无量纲的，因为只有大小，没有单位。其次就是比值，因为一般来说比值都是由一个量纲除以了某个量纲后得到的，比如速度可以有“k m / s km/skm/s”，“m / s m/sm/s”等等。还有一个很显眼的无量纲，就是协方差的相关系数，因为协方差的相关系数是协方差归一化后得到的结果，可以用来衡量相关性，既然能够直接拿来衡量相关性，那么就是无量纲的。

2 标准化

标准化（standardization）是一种特征缩放（feature scale）的方法，在书《python machine learning》中，关于标准化的定义如下：

用我粗糙的英语翻译一下就是：

梯度下降是受益于特征缩放的算法之一。有一种特征缩放的方法叫标准化，标准化使得数据呈现正态分布，能够帮助梯度下降中学习进度收敛的更快。标准化移动特征的均值（期望），使得特征均值（期望）为0，每个特征的标准差为1。

标准化公式如下：

我们先翻译解释，再解释图片：

3 归一化

归一化（normalization）和标准化（standardization）区别不是很大，都是特征缩放（feature scale）的方式。

有的资料中说的，归一化是把数据压缩到[ 0 , 1 ] [0,1][0,1]，把量纲转为无量纲的过程，方便计算、比较等。

在书本《python machine learning》中对归一化的定义为：

翻译如下：

4 正则化

正则化（regularization）是与标准化还有归一化完全不同的东西。正则化相当于是个惩罚项，用于惩罚那些训练的太好的特征。

在书《python machine learning》中，对于正则化的描述如下：

我们来翻译一下：

正则化就是用来处理collinearity的，这个collinearity指的是与特征高度相关，清理掉数据的噪声，最终阻止过拟合。而正则化实际上就是引入一个额外的信息（偏置）来惩罚极端的参数（权重）值。

我们借用吴恩达老师的PPT来说：

我们看到图三这个曲线非线性拟合的太完美了，那么就造成了过拟合，造成的原因是因为特征过多，训练的太好了，而这个特征过多，我个人认为就对应了上面英文中的collinearity (high correlation among features)。

减少特征个数（特征约减）：

手工保留部分特征（你觉得你能做到么？反正我觉得我做不到）
模型选择算法（PCA，SVD，卡方分布）正则化：保留所有特征，惩罚系数θ ，使之接近于0，系数小，贡献就小。

所以也就对应了书本上的惩罚极端参数值。

5 总结

量纲与无量纲的区别就是：物理量是否与单位有关。
标准化与归一化没有显著的区别，具体是谁要依据上下文确定。
归一化是把特征缩放到[ 0 , 1 ] [0,1][0,1]，标准化是把特征缩放到均值为0，标准差为1。
正则化是与标准化和归一化完全不同的东西，是用于惩罚训练的太好的参数，防止模型过拟合，提高模型的泛化能力。

补充：
对于标准化和归一化，消除的是某列（特征）的量纲差异，方便模型训练。并不是对于不同列（特征）间的差异 —— 特征的权重分配问题。

参考：https://blog.csdn.net/qq_35357274/article/details/109371492

http://chatgpt.dhexx.cn/article/4uu2Eq50.shtml

相关文章

数据预处理之数据无量纲化(标准化/归一化)

数据预处理之数据无量纲化(标准化/归一化)

在进行特征选择之前，一般会先进行数据无量纲化处理，这样，表征不同属性（单位不同）的各特征之间才有可比性，如1cm 与 0.1kg 你怎么比？无量纲处理方法很多，使用不同的方法，对…

阅读更多...

无量纲化

无量纲化

参考博客:https://www.zhihu.com/question/29316149 1,无量纲化使不同规格的数据转换到同一规格。 2,常见的无量纲化方法有标准化和区间缩放法。 2.1**标准化**的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。　　标准化需要计算特征的…

阅读更多...

什么是无量纲化

什么是无量纲化

首先来了解什么是量纲？ 量纲和单位的区别，长度，时间，质量等都叫做量纲，而米，千米，秒，分钟，等都是单位， 国际单位制规定了七个基本量纲单位，这七个…

阅读更多...

常用的数据无量纲化方法

常用的数据无量纲化方法

常用的数据无量纲方法常用的数据无量纲方法都有什么？1.min-max归一化2.z-score标准化常用的数据无量纲方法都有什么？ 1.min-max归一化该方法是对原始数据进行线性变换，将其映射到[0,1]之间（[-1,1]之间也行）。 d…

阅读更多...

数据预处理——无量纲化处理

数据预处理——无量纲化处理

数据预处理——无量纲化处理 1.无量纲化定义无量纲化，也称为数据的规范化，是指不同指标之间由于存在量纲不同致其不具可比性，故首先需将指标进行无量纲化，消除量纲影响后再进行接下来的分析。 2.无量纲化方法无量纲化方法有很…

阅读更多...

几种指标无量纲化的方法

几种指标无量纲化的方法

统计指标的无量纲化就是将统计指标的实际值转化为评价值。由于统计指标的性质不同，相应地，统计指标实际值转化为评价值的方法也就不同。一、线性无量纲化方法如果无量纲化的指标评价值与指标的实际值之间是呈现线性关系的，这种无量纲化方…

阅读更多...

Latex公式换行编写

Latex公式换行编写

latex在写公式时往往会遇到长公式或者连续等于的情况，这时可以选择公式换行操作： \begin{equation}\begin{aligned}a & bc\\& cb\end{aligned} \end{equation} 得到如下的效果： 其中&是用于标注需要对齐的位置，例如…

阅读更多...

Latex 多行公式换行对齐

Latex 多行公式换行对齐

\begin{equation} \begin{split} x&abc\\ &de\\ &fg \end{split} \end{equation} 效果：

阅读更多...

LaTex排版技巧：[15]公式太长如何换行

LaTex排版技巧：[15]公式太长如何换行

当我们输入的公式较长时，最容易想到的方法是，在会出现越界的情况，使用强制换行\\，但是这种方法在公式中行不通。通常，我们行间公式的换行可使用split 环境来实现。如 \[ \begin{split} x & \sqrt {1-y^2}\\ x &am…

阅读更多...

LaTex常用技巧5：公式太长换行并加大括号

LaTex常用技巧5：公式太长换行并加大括号

使用LaTex做笔记的时候发现公式太长，一行会超出页面，于是想到换行。原来的代码，这里使用了包bm，测试的时候前面请使用\usepackage{bm}。 \begin{equation}_{i}^{G} {\bm{a}}\begin{cases} _{i}^{i-1}\ddot{\bm{p}}, &i1\\_…

阅读更多...

Latex 公式太长，换行等号对其

Latex 公式太长，换行等号对其

首先一定要插入两个包： \usepackage{amsmath} \usepackage{amssymb} 如果不插入包的话，每次运行到aligned就会报错然后文章中可如下编译公式： \begin{equation}\label{1} \begin{aligned} a & b c \\ & d e \end{aligned}…

阅读更多...

latex如何实现单元格内文字的换行

latex如何实现单元格内文字的换行

问题描述使用latex绘制表格时，有时候会遇到单元格的文字过长，显得很拥挤，适当的换行可以使整体效果更加美观，比如： 源代码为： \resizebox{\textwidth}{!}{\begin{tabular}{cccccccc}\toprule\textbf{Nam…

阅读更多...

Latex公式排版（编号、换行、括号内换行、对齐）

Latex公式排版（编号、换行、括号内换行、对齐）

最近写论文刚上手了Latex，因为有模板，所以用起来还是很方便的。但是在实际使用中，由于论文是双栏的，因此比较长的公式在排版时会比较困难。下面对Latex中的公式排版方法做一些记录。公式的编写方法在此不再赘述。可以选择网页版…

阅读更多...

LaTex长公式换行及对齐

LaTex长公式换行及对齐

长公式换行用\\，对齐用&，宏包\usepackage{amsmath} 示例代码 \begin{equation*}%加*表示不对公式编号 \begin{split} PMV &[0.303*exp(-0.036M)0.0275]*\{M-W-3.05*[5.733-\\ &0.007(M-W)-P_a]-0.42*(M-W-58.2)-0.0173M*\\ &(5.867-P_…

阅读更多...

latex论文中行内公式太长需换行

latex论文中行内公式太长需换行

论文latex 行内公式太长怎么换行研究生论文写作，度娘了很久都没找到直接的答案方法如下：我的整体代码如下：效果如下： 研究生论文写作，度娘了很久都没找到直接的答案需要将行内公式换行，使其不超出页面 …

阅读更多...

Latex行内公式或行间公式太长换行

Latex行内公式或行间公式太长换行

行内公式代码： %错误示范 Then it sets ABETs the master public key $m p k_{A B E T}\left(g, h, u, v, w, e(g, g)^{\alpha}, e(g, h)^{\delta},\left\{h_{i}^{\alpha}\right\}_{i \in[1, n]},\left\{g_{i}g^{z_{i}}\right\}_{i \in[1, n]},{{h}^{\alpha }},{…

阅读更多...

Latex 公式换行问题（换行，等号对齐）

Latex 公式换行问题（换行，等号对齐）

Latex 公式换行问题（换行，等号对齐） 作为一个研究生肯定避免不了写论文，在这个过程中latex使用就尤为重要，他会帮助你们实现期刊格式要求的排版。今天就简单说一下我在写论文过程中遇到的问题之一，公示太长…

阅读更多...

Latex中多行公式换行及设置编号位置

Latex中多行公式换行及设置编号位置

1. 公式换行公式换行的方式有很多种，介绍三种 （1）用equation结合aligned： \begin{equation}\label{eqn:1} \begin{aligned} & a b \\ & c d \\ & e f. \end{aligned} \end{equation} 结果为： &a…

阅读更多...

【C语言】用C语言实现最大公约数和最小公倍数【超详细讲解】

【C语言】用C语言实现最大公约数和最小公倍数【超详细讲解】

最大公约数： “最大公因数，也称最大公约数、最大公因子，指两个或多个整数共有约数中最大的一个。a，b的最大公约数记为（a，b），同样的，a，b，c的最大公…

阅读更多...

LRN与BN

LRN与BN

LRN是作用于卷积的一种优化，即局部响应归一化层。它的作用是减少过拟合的产生，一般用在卷积RULE激活函数之间。具体是实现如下： 公式看起来有一些麻烦，但我们不需要关心公式的组成，我们考虑其中的原理即可。为什么要…

阅读更多...

推荐文章