特征工程—数据无量纲化之归一化

article/2025/11/9 21:40:50

在sklearn中使用preprocessing预处理与impute缺失值处理，两个模块进行数据预处理

数据无量纲化：将不同量纲的数据转化到同一区间，避免某一取值的数据范围太大或太小对影响计算，加快求解速度，提高精度

无量纲化包括线性与非线性

线性无量纲化包括中心化与缩放处理

中心化：将原数据减去某一个值，将数据平移到某位置

缩放处理：将数据除以某值，将数据固定到某位置

数据归一化：将数据进行缩放与收敛处理，通常将数据归一到【0-1】区间，也可以归一到其他区间，归一化后数据服从正态分布

归一化公式：x - 最小值 / 极差（最大值-最小值）（注：计算范围是每一列数据）

sklearn进行归一化代码：

from sklearn.preprocessing import MinMaxScaler   #导入归一化库
data = [[-1,2],[-0.5,6],[0,10],[1,18]]
import pandas as pd
pd.DataFrame(data)#实现归一化
one = MinMaxScaler()          #实列化
scaler = one.fit(data)        #fit归一化模型
re = scaler.transform(data)   #接口导出结果
re

上述归一化后两列数据相同，说明数据中信息相同

r = scaler.fit_transform(data)  #训练与导出结果同时进行
r

将数据归一化到【5-10】区间

data = [[7,2],[-0.5,20],[0,10],[1,18]]
s = MinMaxScaler(feature_range=[5,10])   #将数据归一化到[5-10]区间
res = s.fit_transform(data)
res

归一化逆转

s.inverse_transform(res)   #归一化后实现逆转

特征工程—数据无量纲化之归一化

在sklearn中使用preprocessing预处理与impute缺失值处理，两个模块进行数据预处理

数据无量纲化：将不同量纲的数据转化到同一区间，避免某一取值的数据范围太大或太小对影响计算，加快求解速度，提高精度

无量纲化包括线性与非线性

线性无量纲化包括中心化与缩放处理

中心化：将原数据减去某一个值，将数据平移到某位置

缩放处理：将数据除以某值，将数据固定到某位置

数据归一化：将数据进行缩放与收敛处理，通常将数据归一到【0-1】区间，也可以归一到其他区间，归一化后数据服从正态分布

归一化公式：x - 最小值 / 极差（最大值-最小值）（注：计算范围是每一列数据）

sklearn进行归一化代码：

上述归一化后两列数据相同，说明数据中信息相同

将数据归一化到【5-10】区间

归一化逆转

相关文章

数据挖掘的步骤——降维处理前一定记得进行无量纲化处理

#第27篇分享：数据无量纲化（python语言：sklearn 预处理及特征工程）（3）

均值归一化_数据无量纲化处理（归一化VS标准化）

特征工程：特征预处理(无量纲化处理)

为什么梯度的负方向是梯度下降最快的方向

数字图像处理基于matlab、opencv计算图像的梯度方向和梯度幅值

梯度方向直方图Histogram of Oriented Gradients (HOG)

为什么梯度方向一定是函数增大的方向

为什么沿梯度方向，函数变化最快？？？

机器学习算法篇：从为什么梯度方向是函数变化率最快方向详谈梯度下降算法

⚡可行梯度方向法⚡（Feasible Gradient Direction Method ，FGDM）

梯度方向为何变化率最大

梯度下降算法过程及为什么负梯度方向是下降最快方向(附代码)

微积分：如何理解方向导数与梯度？

Opencv中计算梯度、梯度幅值以及梯度方向的相关函数

梯度方向，梯度下降法，牛顿法

函数的梯度方向和切线方向_导数、方向导数与梯度

梯度方向与等高线方向垂直的理解

为什么梯度方向一定是函数增大的方向？

为什么梯度是上升方向，梯度下降要取负？