超详细SPSS主成分分析计算指标权重(一)

article/2025/5/16 20:09:13

一、指标权重计算确定的困惑

相信很多写过或者正在写指标处理类论文的朋友都曾对如何计算指标权重充满困惑,到底是用熵值法,还是主成分分析法?或者其他各种看起来奥妙无穷却难以上手操作的神奇方法?好不容易确定要选用主成分分析法时又开始发愁要如何实现呢?听说过要可以用SPPS,可是又如何使用SPSS操作呢?用SPSS进行主成分分析之后又要如何得到最终的权重呢?接下来笔者将以一个实际的案例,带领大家一步步从SPSS入手,进行主成分分析,并利用主成分分析的结果最终得到各指标的权重值。

二、利用SPSS实现主成分分析

1、数据标准化
(1)为什么要对数据进行标准化处理

在对数据进行主成分分析前,首先要对数据进行标准化,之所以要对数据进行标准化,是因为各种类别的数据间的度量不同,比如计算经济的指标,我们通常会选取地区GDP生产总值和第三产业产值在GDP中的比重,GDP产值以亿为单位,通常以千计或万计,而第三产业产值在GDP中的比重的取值范围在0~1之间,如何能够相提并论呢?能够因为前者的数据远远大于后者,而得出前者的指标更为重要的结论吗?显然是不行的,所以要进行主成分分析,首先要对数据进行标准化。

(2)数据标准化的方法

为什么要关心数据处理的方法呢?在实际操作中,笔者曾经遇到一个问题。笔者利用SPSS自带的数据标准化方法对数据进行了标准化处理,但在权重的计算过程中不断出现负值,后来笔者几次重新调整指标类别,终于得出了均为正值的权重。但笔者最终的目的是要进行耦合协调度,这时候出现了大量的负值,而耦合度及耦合协调度的取值范围应该在0~1之间,因此笔者开始从头探索出错的原因。终于,笔者找到了原因,那就是数据标准化的方法选取的不正确,因此笔者重新选择了极差法对数据重新进行标准化,并最终顺利得到了后续的结果。

本文中笔者将先直接利用SPSS对数据进行标准化,进行主成分分析,并计算权重。随后再利用极差法对数据进行标准化并进行主成分分析,计算权重。

在这里先列出极差法数据标准化的方法:
首先要区分指标的正负向,即指标数值越大对主体产生的结果是越好还是越坏。
在这里插入图片描述
如上图,城市绿地面积越大对城市环境越好,而工业废气排放量越大,对城市环境越坏,因此城市绿地面积为正向指标,而工业废气排放量为负向指标。

2.SPSS数据标准化
(1)数据选取
我们选择广东省2016年21个市级行政区域的五项指标数据,如下图所示:
在这里插入图片描述
(2)SPSS中的数据标准化
首先将数据直接粘贴到SPSS数据视图中:
在这里插入图片描述
发现表头那里是自动生成的标号,在“变量视图”中进行修改:
在这里插入图片描述
这时候在数据视图可以看到表头已经修改:
在这里插入图片描述
这时候开始进行数据标准化处理,也很简单,点击【分析】——【描述统计】——【描述】在这里插入图片描述
将选中数据放入右侧“变量”,将左下角“将标准化得分另存为变量(Z)”,这一步一定不能缺少,否则无法在变量视图中展现标准化的数据:
在这里插入图片描述
直接点击确定,不用管输入的内容,直接看回“数据视图”,发现新增加了五列数,这些就是用SPSS标准化处理后得到的数据。
在这里插入图片描述
(3)主成分分析
首先什么是主成分分析?如何进行主成分分析?由于数据之间可能会具有相关性,即可能表达的是同样的含义,因此需要的对这些相关性的数据进行降维处理,用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,并用以解释资料的综合性指标。简单来说就是,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。利用SPSS极大的简化了以上过程:
点击【分析】——【降维】——【因子分析】
在这里插入图片描述
将刚才标准化得到的数据项添加到“变量中”:
在这里插入图片描述
接下来,点击:【描述】——选中“原始分析结果”,“系数”,“KMO和Bartlett球形度检验”(用来检测是否适合使用主成分分析)
在这里插入图片描述
点击:【抽取】——【主成分分析】,其他选项默认
在这里插入图片描述
点击:【旋转】——选择“最大方差法”,“旋转解”(也可以选择无,在某些情况下数据会出现异常结果,这时会需要进行矩阵旋转)
在这里插入图片描述
点击:【得分】,选择“显示因子得分系数矩阵”(对于权重计算来说这必不可少)
在这里插入图片描述
点击:【选项】,其他选项可默认
在这里插入图片描述
当一切设置完毕之后,点击“确定”,就可以得到主成分分析结果了:
我们主要关注【解释的总方差】和【成分矩阵】,这也是后面计算权重所不可缺少的。通常解释的总方差需要超过80%,说明提取的两个总方差对总体方差的贡献率高。从笔者分析的结果来说,好像并不适合进行主成分分析。这其实是由于数据标准化选择不可造成的,有的情况下权重计算还可以得出负值,这就是为什么要选择数据标准化的方法,而不能够只依靠SPSS中的数据标准化。相信这也困惑了很多的朋友,怀疑自己选取指标体系的合理性,在后面笔者使用极差法对数据进行标准化处理后,解释的总方差接近95%。
在这里插入图片描述
成分矩阵在后面全之后结果的计算中,是不可或缺的。

在这里插入图片描述
由于篇幅的原因,接下来利用极差法对数据进行标准化以及权重的计算将放到第二节进行。后面在得出指标权重后,笔者还将分享如何进行多个指标系统之间耦合度及耦合协调度的方法,相信这也曾经难倒了不少朋友,笔者希望能为大家解决一些障碍,降低各位的时间成本。下面是第二节权重计算及极差法标准化的链接:

超详细SPSS主成分分析计算指标权重(二:权重计算及极差法标准化)
https://blog.csdn.net/qq_32925031/article/details/88562141


http://chatgpt.dhexx.cn/article/MgKSUPgK.shtml

相关文章

一文读懂 主成分分析 与 因子分析

2023-2-20更新:  修改了一些文字错误,优化了排版,增加了一些拓展内容,祝大家学业有成!(期待三连😁😁) 目录 一、 主成分分析二、因子分析三、多元共线性问题简介3.1 多…

主成分之综合竞争力案例分析

一、案例背景 1.案例说明 研究调查100家公司2010-2013年关于财务方面的具体数据,这些财务指标维度分别为盈利能力、偿债能力、运营能力、发展能力以及公司治理。其中每个维度分别有几个分析项,但是有些指标是越大越好,有些指标是越小越好。…

数据分析,主成分分析例题

已知协方差矩阵求X的各主成分以及主成分的贡献率 主成分分析 原理:找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,且彼此之间互不相关 统计方法:主成分分析(主分量分析&…

主成分分析PCA案例及原理

1. 主成分分析PCA案例 https://blog.csdn.net/goodshot/article/details/78080220 http://www.cnblogs.com/zhangchaoyang/articles/2222048.html 附: 使用上方链接的解释: 2. 主成分分析(PCA)原理总结http://www.cnblogs.com/pinard/p/623…

主成分分析简单例子

一、数据降维 对于现在维数比较多的数据,我们首先需要做的就是对其进行降维操作。降维,简单来说就是说在尽量保证数据本质的前提下将数据中的维数降低。降维的操作可以理解为一种映射关系,例如函数,即由原来的二维转换成了一维。处…

spss分析方法-主成分分析

spss分析方法-主成分分析(转载) 主成分分析利用的是“降维”的思想,利用原始变量的线性组合组成主成分。在信息损失较小的前提下,把多个指标转化为几个互补相关的综合指标。下面我们主要从下面四个方面来解说: 实际…

主成分分析案例

去百度文库上一搜,是很老的题目了。这里所做的只是准备工作,为后面更多的数据处理做准备。 例题 1.对原始资料矩阵进行标准化处理 zef_data xlsread(chengshi.xls); z zscore(zef_data) z 1.1977 0.7149 0.6674 1.1390 0.9189 3.111…

快速搞定PCA(主成分分析)(原理 代码 案例)

目录 一、基本介绍 1.1原理 1.2主成分分析的几何解释 1.3主要步骤 1.4主成分个数的选取原则 二、主成分分析代码 2.1MATLAB代码 2.2Python代码 三、实用案例 一、基本介绍 1.1原理 主成分分析是最常用的线性降维方法,通过某种线性投影,将高维的数…

【机器学习】主成分分析实现案例 (PCA)

一、说明 这篇文章的目的是提供主成分分析(PCA)的完整和简化的解释。我们将逐步介绍它是如何工作的,这样每个人都可以理解并使用它,即使是那些没有强大数学背景的人。 PCA是网络上广泛覆盖的机器学习方法,并且有一些关…

什么是主成分分析?经典案例解析变量降维

1、作用 主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小&…

比较两篇文章的相似性方法

对于这个题目,开始毫无头绪,后来经过查阅资料现在讲方法总结如下: 1、利用余弦定理 我们知道向量 a,b之间的夹角可用余弦定理求得: 如果夹角的余弦值越小,那么夹角也越大。如果2个向量相等,那么其值为1。利…

Python案例分析|文本相似度比较分析

本案例通过设计和实现有关文本相似度比较的类Vector和Sketch,帮助大家进一步掌握设计Python类来解决实际问题的能力。 01、文本相似度比较概述 通过计算并比较文档的摘要可实现文本的相似度比较。 文档摘要的最简单形式可以使用文档中的k-grams(k个连…

计算机如何判断两篇文章相似性

这个仍然是极客时间上,关于《索引技术核心20讲》的一篇笔记同时结合自己的理解加了点料,这个专栏虽然只有20讲,但是真不错,老师解答问题还是很积极,回答字数经常比问题字数多。有兴趣的朋友可以到我星球(在…

ai写文章检测原理(文章相似度检测)

小编来了!今天要和大家聊一聊关于ai写文章检测原理的评测对比。究竟哪种方法更加高效准确呢?让我们一起来看看吧! 概括:本文将从多个角度对ai写文章检测原理进行评测对比,包括算法准确性、速度、自动化程度、用户体验…

【跨语言剽窃检测】文本相似度分析之一

对比文件1: 2010年的跨语言剽窃检测新方法 作者RaFael Corezola Pereira instituion : UFRGS 摘要: 作者提出一个跨语言剽窃检测新方法,分为5个主要阶段: languange normalization、retrieval of candidate documents、classfier …

文本相似度综述

本文目录 文本相似度的定义文本相似度计算方法基于字符串的方法基于语料库的方法基于词袋VSMLSA、PLSALDA(需要进一步了解) 基于神经网络基于搜索引擎 基于世界知识基于本体基于网络知识 其他方法句法分析混合方法 文本相似度的定义 其中, common&#x…

JAVA-计算两篇文章的相似度

1.场景: 在很多公司的文件管理系统中,都有类似于对比多篇文章的相似度,例如在写公众号推文时,如果标记了原创,就会对比当前文章和库里已存在文章的相似程度,如果相似度过于高,则标记为原创的文章…

免费好用的文章相似度检测软件推荐

相信很多人在写作的时候都会遇到这样的问题,就是怕自己写出的文章被抄袭。为了保证自己的原创性,我们需要使用一些文章相似度检测软件来帮助我们检测文章是否被抄袭。那么,有哪些免费好用的文章相似度检测软件呢?下面就为大家介绍…

判断两篇文章的相似度

判断相似度 基于jieba 关键字提取的方法textrank关键字的提取代码:tf-idf关键字的提取代码:统计数据统计数据的代码:完整代码: 基于jieba 关键字提取的方法 textrank 1,将待抽取关键词的文本进行分词 2,以…

检测文章相似度的方法?文章原创度检测工具免费

免费检测文章相似度的软件,什么是检测文章相似度的软件,简单来说就是原创检测工具,相信不少的朋友都在利用这个功能来检测自己文章的原创度是多少?要做好一篇文章真的只需要检测文章的相似度吗?答案:肯定是…