目录
1 数据格式
2 不同属性类型的指标规范化方法
2.1 效益型指标:即该指标越大越好
2.2 成本型指标:即该指标越小越好
2.3 固定型/中间型指标:在某个固定值处最好
2.4 区间型指标:有最佳区间
2.5 偏离区间型:偏离某个区间越远越好
2.6 偏离固定值型:偏离某个固定值越远越好
3 相同属性类型指标的规范化方法
3.1 归一化方法
3.2 最大化方法
3.3 模一化方法
1 数据格式
假设一份数据有n个个案(横),m个属性(纵),数据格式如下:
属性x1 | 属性x2 | ... | 属性xm | |
id1 | ||||
id2 | ||||
... | ||||
idn |
用矩阵的形式表示(也称“决策矩阵”):
2 不同属性类型的指标规范化方法
理解:即x1、x2、x3不同属性类型,如x1单位为万元,x2单位为千克,x3单位为万人,这种情况比较多见。
2.1 效益型指标:即该指标越大越好
对某个效益型属性指标,令
或
该方法规范化的结果是将效益型指标转化为(0,1] 或 [0,1] 型无量纲效益型指标。
2.2 成本型指标:即该指标越小越好
对某个成本型属性指标,令
或
该方法规范化的结果是将成本型指标转化为(0,1] 或 [0,1] 型无量纲效益型指标。
2.3 固定型/中间型指标:在某个固定值处最好
对某固定型属性指标,假设其固定值为
,令
该方法规范化的结果是把偏离固定值最远的点化为0,等于固定值的点化为1。
2.4 区间型指标:有最佳区间
对某区间型属性指标,假设其最佳区间为[p,q],令
该方法规范化的结果是把区间指标转化为 [0,1] 型无量纲效益型指标。
2.5 偏离区间型:偏离某个区间越远越好
对于某个偏离区间(不妨设为[p,q])型属性指标 ,令
该方法规范化的结果是把偏离区间指标转化为 [0,1] 型无量纲效益型指标。
2.6 偏离固定值型:偏离某个固定值越远越好
对于某个偏离固定值(不妨设为)型属性指标
,令
该方法规范化的结果是把偏离固定值指标转化为 [0,1] 型无量纲效益型指标。
3 相同属性类型指标的规范化方法
理解:即x1、x2、x3单位一致,如都是万元、都是千克、都是万人。比较少见一点。
3.1 归一化方法
对第个指标
,令
如此得到的标准化矩阵的各个列向量的分量之和为1,所以称归一化方法。
3.2 最大化方法
这样得到的标准化矩阵的各个列向量的分量最大值为1,所以称最大化方法。
3.3 模一化方法
这样得到的标准化矩阵的各个列向量的模均为1,所以称为模一化方法。
参考:
[1] 刘保东、宿洁、陈建良.数学建模基础教程[M].北京:高等教育出版社,2015.9:404-407