[评价体系] 1、数据规范化/无量纲化方法

article/2025/9/15 20:12:57

目录

1 数据格式

2 不同属性类型的指标规范化方法

2.1 效益型指标:即该指标越大越好

2.2 成本型指标:即该指标越小越好

2.3 固定型/中间型指标:在某个固定值处最好

2.4 区间型指标:有最佳区间

2.5 偏离区间型:偏离某个区间越远越好

2.6 偏离固定值型:偏离某个固定值越远越好

3 相同属性类型指标的规范化方法

3.1 归一化方法

3.2 最大化方法

3.3 模一化方法


1 数据格式

假设一份数据有n个个案(横),m个属性(纵),数据格式如下:

属性x1属性x2...属性xm
id1
id2
...
idn

用矩阵的形式表示(也称“决策矩阵”):

A=\begin{bmatrix} a_1_1 & a_1_2& ... & a_1_m\\ a_2_1 & a_2_2& ... & a_2_m\\ ...& ... & ... &... \\ a_n_1 & a_n_2& ... & a_n_m \end{bmatrix}

2 不同属性类型的指标规范化方法

理解:即x1、x2、x3不同属性类型,如x1单位为万元,x2单位为千克,x3单位为万人,这种情况比较多见。

2.1 效益型指标:即该指标越大越好

对某个效益型属性指标x_j,令

r_i_j=\frac{a_i_j}{max_i(a_i_j)}  或

r_i_j=\frac{a_i_j-min_i(a_i_j)}{max_i(a_i_j)-min_i(a_i_j)} , i=1,2,...,n

该方法规范化的结果是将效益型指标转化为(0,1] 或 [0,1] 型无量纲效益型指标。

2.2 成本型指标:即该指标越小越好

对某个成本型属性指标x_j,令

r_i_j=\frac{min_i(a_i_j)}{a_i_j}

r_i_j=\frac{max_i(a_i_j)-a_i_j}{max_i(a_i_j)-min_i(a_i_j)} , i=1,2,...,n

 该方法规范化的结果是将成本型指标转化为(0,1] 或 [0,1] 型无量纲效益型指标

2.3 固定型/中间型指标:在某个固定值处最好

对某固定型属性指标x_j,假设其固定值为a_j,令

r_i_j=1-\frac{a_i_j-a_j}{max_i|a_i_j-a_j|} , i=1,2,...,n

该方法规范化的结果是把偏离固定值最远的点化为0,等于固定值的点化为1。

2.4 区间型指标:有最佳区间

对某区间型属性指标x_j,假设其最佳区间为[p,q],令

r_i_j=\left\{\begin{matrix} 1-\frac{max_i(p-a_i_j,a_i_j-q)}{max_i(p-min_i(a_i_j),max_i(a_i_j)-q)} &,a_i_j\notin [p,q] \\ 1 & ,a_i_j\in [p,q] \end{matrix}\right. , i=1,2,...,n

 该方法规范化的结果是把区间指标转化为 [0,1] 型无量纲效益型指标

2.5 偏离区间型:偏离某个区间越远越好

对于某个偏离区间(不妨设为[p,q])型属性指标 x_j,令

r_i_j=\left\{\begin{matrix} \frac{max_i(p-a_i_j,a_i_j-q)}{max_i(p-min_i(a_i_j),max_i(a_i_j)-q)} &,a_i_j\notin [p,q] \\ 0 & ,a_i_j\in [p,q] \end{matrix}\right. , i=1,2,...,n

 该方法规范化的结果是把偏离区间指标转化为 [0,1] 型无量纲效益型指标。 

2.6 偏离固定值型:偏离某个固定值越远越好

对于某个偏离固定值(不妨设为\beta)型属性指标 x_j,令

r_i_j=\frac{|a_i_j-\beta|-min_i|a_i_j-\beta|}{max_i|a_i_j-\beta|-min_i|a_i_j-\beta|}, i=1,2,...,n

 该方法规范化的结果是把偏离固定值指标转化为 [0,1] 型无量纲效益型指标

3 相同属性类型指标的规范化方法

理解:即x1、x2、x3单位一致,如都是万元、都是千克、都是万人。比较少见一点。

3.1 归一化方法

对第j(j=1,2,...m)个指标x_j,令

r_i_j=\frac{a_i_j}{\sum_{i=1}^{n}a_i_j}\,i=1,2,...,n

如此得到的标准化矩阵R=(r_i_j)_{n\times m}的各个列向量的分量之和为1,所以称归一化方法。

3.2 最大化方法

r_i_j=\frac{a_i_j}{max_i(a_i_j)}\,i=1,2,...,n

这样得到的标准化矩阵R=(r_i_j)_{n\times m}的各个列向量的分量最大值为1,所以称最大化方法。

3.3 模一化方法

r_i_j=\frac{a_i_j}{\sqrt{\sum_{i=1}^{n}a_{ij}^{2}}},i=1,2,...,n

这样得到的标准化矩阵R=(r_i_j)_{n\times m}的各个列向量的模均为1,所以称为模一化方法。

参考:

[1] 刘保东、宿洁、陈建良.数学建模基础教程[M].北京:高等教育出版社,2015.9:404-407


http://chatgpt.dhexx.cn/article/pOR8xrPT.shtml

相关文章

机器学习学习笔记(3)——量纲与无量纲,标准化、归一化、正则化

量纲、无量纲,标准化、归一化、正则化是我百度了很多次都不进脑子的知识,所以我决定还是放在博客上面。 不过鉴于我查阅了很多资料,说是有许多的坑,所以我也不清楚我的理解和解释是否是坑,具体的就留给各位来帮忙评判了…

数据的无量纲化处理和标准化处理的区别是什么

数据的无量纲化处理和标准化处理的区别是什么 请教:两者除了方法上有所不同外,在其他方面还有什么区别? 解答: 标准化处理方法是无量纲化处理的一种方法。除此之外,还有相对化处理方法(包括初值比处理)、函数化(功效系数)方法,等等。由于标准化处理方法可以与分布…

数据归归一化方法(标准化)

数据归一化方法 数据标准化(normalization)数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。 数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标…

特征锦囊:特征无量纲化的常见操作方法

今日锦囊 特征无量纲化的常见操作方法 第一招,从简单的特征量纲处理开始,这里介绍了3种无量纲化操作的方法,同时也附上相关的包以及调用方法,欢迎补充! 无量纲化:即nondimensionalize 或者dimensionless&am…

数据挖掘——无量纲化

在进行特征选择之前,一般会先进行数据无量纲化处理,这样,表征不同属性(单位不同)的各特征之间才有可比性,如1cm 与 0.1kg 你怎么比?无量纲处理方法很多,使用不同的方法,对…

量纲与无量纲、标准化、归一化、正则化【能够帮助梯度下降中学习进度收敛的更快、提升模型的收敛速度提升模型的精度、防止模型过拟合,提高模型的泛化能力】

目录 1 量纲与无量纲 1.1 量纲 1.2 无量纲 2 标准化 3 归一化 归一化的好处 4 正则化 5 总结 1 量纲与无量纲 1.1 量纲 物理量的大小与单位有关。就比如1块钱和1分钱,就是两个不同的量纲,因为度量的单位不同了。 1.2 无量纲 物理量大小与单位…

数据预处理----数据无量纲化(归一化和标准化)

文章目录 概述数据挖掘的五大步骤skleran中的数据处理和特征工程 数据预处理Preprocessing数据无量纲化数据归一化---MinMaxScaler示例 数据标准化----StandardScaler示例 MinMaxScaler和StandardScaler应该选哪个 概述 数据挖掘的五大步骤 数据获取数据预处理 数据预处理是从…

数学分析模型(一):数据的无量纲处理方法及示例(附完整代码)

数据的无量纲处理方法及示例(附完整代码) (1)极值化方法(2)标准化方法(3)均值化方法示例要求建模步骤程序结果备注在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得…

数据无量纲化

数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向…

量纲化处理汇总

在实际研究中,不同的变量单位不同,数值差异极大。例如100g和1m等。 因此有时需要对数据进行去量纲,所谓的去量纲就是‘去掉’单位对数值的影响。但是量纲化有很多种方式,但具体应该使用哪一种方式,并没有固定的标准&am…

数据预处理--无量纲化

1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。 2.无量纲化方法 无量纲化方法有很多,但是从几何角度来…

多指标综合评价中指标正向化和无量纲化方法的选择

摘要:本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例…

量纲与无量纲,标准化、归一化、正则化

量纲与无量纲,标准化、归一化、正则化 1 量纲与无量纲1.1 量纲1.2 无量纲 2 标准化3 归一化4 正则化5 总结 1 量纲与无量纲 1.1 量纲 量纲我觉得最重要的一句话是:物理量的大小与单位有关。 从这句话我们来思考下最核心的两个单词:大小、单…

数据预处理之数据无量纲化(标准化/归一化)

在进行特征选择之前,一般会先进行数据无量纲化处理,这样,表征不同属性(单位不同)的各特征之间才有可比性,如1cm 与 0.1kg 你怎么比?无量纲处理方法很多,使用不同的方法,对…

无量纲化

参考博客:https://www.zhihu.com/question/29316149 1,无量纲化使不同规格的数据转换到同一规格。 2,常见的无量纲化方法有标准化和区间缩放法。 2.1**标准化**的前提是特征值服从正态分布,标准化后,其转换成标准正态分布。   标准化需要计算特征的…

什么是无量纲化

首先来了解什么是量纲? 量纲和单位的区别,长度,时间,质量等都叫做量纲,而米,千米,秒,分钟,等都是单位, 国际单位制规定了七个基本量纲单位,这七个…

常用的数据无量纲化方法

常用的数据无量纲方法 常用的数据无量纲方法都有什么?1.min-max归一化2.z-score标准化 常用的数据无量纲方法都有什么? 1.min-max归一化 该方法是对原始数据进行线性变换,将其映射到[0,1]之间([-1,1]之间也行)。 d…

数据预处理——无量纲化处理

数据预处理——无量纲化处理 1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。 2.无量纲化方法 无量纲化方法有很…

几种指标无量纲化的方法

统计指标的无量纲化就是将统计指标的实际值转化为评价值。由于统计指标的性质不同,相应地,统计指标实际值转化为评价值的方法也就不同。 一、线性无量纲化方法 如果无量纲化的指标评价值与指标的实际值之间是呈现线性关系的,这种无量纲化方…

Latex公式换行编写

latex在写公式时往往会遇到长公式或者连续等于的情况,这时可以选择公式换行操作: \begin{equation}\begin{aligned}a & bc\\& cb\end{aligned} \end{equation} 得到如下的效果: 其中&是用于标注需要对齐的位置,例如…