spss分析方法-主成分分析

article/2025/5/16 21:24:42

spss分析方法-主成分分析(转载)

主成分分析利用的是降维的思想,利用原始变量的线性组合组成主成分。在信息损失较小的前提下,把多个指标转化为几个互补相关的综合指标。
下面我们主要从下面四个方面来解说:

 

  • 实际应用
  • 理论思想
  • 建立模型
     
  • 分析结果


 

一、实际应用


在实际工作中,往往会出现所搜集的变量间存在较强相关关系的情况。如果直接利用数据进行分析,不仅会使模型变得很复杂,而且会带来多重共线性等问题。主成分分析提供了解决这一问题的方法,其基本思想是将众多的初始变量整合成少数几个相互无关的主成分变量,而这些新的变量尽可能地包含了初始变量的全部信息,然后用这些新的变量来代替以前的变量进行分析

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。



 

二、理论思想

主成分分析是将多个变量通过线性变换以选出较少重要变量的一种多元统计分析方法。主成分分析的思想是将原来众多具有一定相关性的变量,重新组合成一组新的互相无关的综合指标来代替原来的指标。它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理。
方差较大的几个新变量就能综合反应原多个变量所包含的主要信息,并且也包含了自身特殊的含义。




 

三、建立模型

主成分分析的基本步骤如下:
 

  • 进行因子分析
  • 计算特征向量矩阵
  • 计算主成分矩阵

主成分分析案例:
 

题目:给出了中国历年国民经济主要指标统计(19982005)。试用主成分分析对这些指标提取主成分并写出提取的主成分与这些指标之间的表达式。


一、数据输入

二、操作步骤1、进入SPSS,打开相关数据文件,选择分析”|“降维”|“因子命令2选择进行因子分析的变量。在因子分析对话框的左侧列表框中,依次选择全国人口、农林牧渔业总产值、工业总产值、国内生产总值、全社会投资总额、货物周转量、社会消费品零售总额、进出口贸易总额、原煤、发电量、原油、钢、汽车、布、糖、粮食、棉花和油料进入变量列表框。

3选择输出系数相关矩阵。

单击因子分析对话框右上角的描述按钮,在相关性矩阵选项组中选中系数复选框,单击继续按钮返回因子分析对话框。

4、其余设置采用系统默认值即可。单击确定按钮,等待输出结果。





 

四、结果分析



1、系数相关矩阵各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近于1,所以本例很适合使用主成分分析。

2、各成分的方差贡献率和累计贡献率只有前两个特征值大于1,所以SPSS只选择了前两个主成分。第一个主成分的方差贡献率是80.233%,第二个主成分的方差贡献率是7.884%,前两个主成分的方差占所有主成分方差的88.118%。由此可见,选择前两个主成分已足够替代原来的变量。


3、成分矩阵下表为成分矩阵,表明各个成分在各个变量上的载荷,从而可以得出各主成分的表达式。值得一提的是,在表达式中各个变量已经不是原始变量,而是标准化变量。


其中:F1=0.523*全国人口+0.990*农林牧渔业总产值+0.908*工业总产值+0.973*国内生产总值+0.995*全社会投资总额+0.991*货物周转量+0.988*社会消费品零售总额+0.998*进出口贸易总额+0.969*原煤+0.996*发电量+0.993*原油+0.992*+0.983*汽车+0.997*+0.571*-0.258*粮食+0.831*棉花+0.727*油料
F2=-0.025*全国人口+0.110*农林牧渔业总产值+0.405*工业总产值+0.055*国内生产总值+0.055*全社会投资总额+0.011*货物周转量-0.008*社会消费品零售总额+0.009*进出口贸易总额+0.174*原煤-0.054*发电量+0.01*原油+0.059*-0.052*汽车-0.018*+0.196*+0.892*粮食-0.205*棉花-0.565*油料

 

在第一主成分中,除粮食以外,变量的系数都比较大,可以看成是反映那些变量方面的综合指标;

在第二主成分中,粮食变量的系数比较大,可以看成是反映粮食的综合指标。


分析结论:(获取更多知识,前往gz号程式解说)
 

因为主成分分析只不过是一种矩阵变换,所以各个主成分并不一定有实际意义,本例中各个主成分的内在含义就不是很明确。



 

参考案例数据:
 

1spss统计分析与行业应用案例详解(第四版杨维忠,张甜,王国平  清华大学出版社

收录于合集 #spss

 16

上一篇spss分析方法-因子分析

原文来自https://mp.weixin.qq.com/s/fTNbEkKKgRETJCj4fSa7sA

 


http://chatgpt.dhexx.cn/article/meRZVifl.shtml

相关文章

主成分分析案例

去百度文库上一搜,是很老的题目了。这里所做的只是准备工作,为后面更多的数据处理做准备。 例题 1.对原始资料矩阵进行标准化处理 zef_data xlsread(chengshi.xls); z zscore(zef_data) z 1.1977 0.7149 0.6674 1.1390 0.9189 3.111…

快速搞定PCA(主成分分析)(原理 代码 案例)

目录 一、基本介绍 1.1原理 1.2主成分分析的几何解释 1.3主要步骤 1.4主成分个数的选取原则 二、主成分分析代码 2.1MATLAB代码 2.2Python代码 三、实用案例 一、基本介绍 1.1原理 主成分分析是最常用的线性降维方法,通过某种线性投影,将高维的数…

【机器学习】主成分分析实现案例 (PCA)

一、说明 这篇文章的目的是提供主成分分析(PCA)的完整和简化的解释。我们将逐步介绍它是如何工作的,这样每个人都可以理解并使用它,即使是那些没有强大数学背景的人。 PCA是网络上广泛覆盖的机器学习方法,并且有一些关…

什么是主成分分析?经典案例解析变量降维

1、作用 主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小&…

比较两篇文章的相似性方法

对于这个题目,开始毫无头绪,后来经过查阅资料现在讲方法总结如下: 1、利用余弦定理 我们知道向量 a,b之间的夹角可用余弦定理求得: 如果夹角的余弦值越小,那么夹角也越大。如果2个向量相等,那么其值为1。利…

Python案例分析|文本相似度比较分析

本案例通过设计和实现有关文本相似度比较的类Vector和Sketch,帮助大家进一步掌握设计Python类来解决实际问题的能力。 01、文本相似度比较概述 通过计算并比较文档的摘要可实现文本的相似度比较。 文档摘要的最简单形式可以使用文档中的k-grams(k个连…

计算机如何判断两篇文章相似性

这个仍然是极客时间上,关于《索引技术核心20讲》的一篇笔记同时结合自己的理解加了点料,这个专栏虽然只有20讲,但是真不错,老师解答问题还是很积极,回答字数经常比问题字数多。有兴趣的朋友可以到我星球(在…

ai写文章检测原理(文章相似度检测)

小编来了!今天要和大家聊一聊关于ai写文章检测原理的评测对比。究竟哪种方法更加高效准确呢?让我们一起来看看吧! 概括:本文将从多个角度对ai写文章检测原理进行评测对比,包括算法准确性、速度、自动化程度、用户体验…

【跨语言剽窃检测】文本相似度分析之一

对比文件1: 2010年的跨语言剽窃检测新方法 作者RaFael Corezola Pereira instituion : UFRGS 摘要: 作者提出一个跨语言剽窃检测新方法,分为5个主要阶段: languange normalization、retrieval of candidate documents、classfier …

文本相似度综述

本文目录 文本相似度的定义文本相似度计算方法基于字符串的方法基于语料库的方法基于词袋VSMLSA、PLSALDA(需要进一步了解) 基于神经网络基于搜索引擎 基于世界知识基于本体基于网络知识 其他方法句法分析混合方法 文本相似度的定义 其中, common&#x…

JAVA-计算两篇文章的相似度

1.场景: 在很多公司的文件管理系统中,都有类似于对比多篇文章的相似度,例如在写公众号推文时,如果标记了原创,就会对比当前文章和库里已存在文章的相似程度,如果相似度过于高,则标记为原创的文章…

免费好用的文章相似度检测软件推荐

相信很多人在写作的时候都会遇到这样的问题,就是怕自己写出的文章被抄袭。为了保证自己的原创性,我们需要使用一些文章相似度检测软件来帮助我们检测文章是否被抄袭。那么,有哪些免费好用的文章相似度检测软件呢?下面就为大家介绍…

判断两篇文章的相似度

判断相似度 基于jieba 关键字提取的方法textrank关键字的提取代码:tf-idf关键字的提取代码:统计数据统计数据的代码:完整代码: 基于jieba 关键字提取的方法 textrank 1,将待抽取关键词的文本进行分词 2,以…

检测文章相似度的方法?文章原创度检测工具免费

免费检测文章相似度的软件,什么是检测文章相似度的软件,简单来说就是原创检测工具,相信不少的朋友都在利用这个功能来检测自己文章的原创度是多少?要做好一篇文章真的只需要检测文章的相似度吗?答案:肯定是…

[将小白进行到底] 如何比较两篇文章的相似度

其实这个题目已经有很多人写过了,数学之美里就有,最近阮一峰的博客里也写了,本文基本上遵循的就是他的思路,只是让其看起来再小白一点点。其实说白了就是用自己的话,再把同样一件事描述一下,顺便扩扩句&…

文本相似度的检测

项目原理 基于词频:统计文章中词频,构建词频特征向量,利用特征向量夹角的余弦值表示文本的相似度。两篇文章最大相似度为1,特征向量夹角为0。 基于词频的文本相似度检测步骤: 文本1和文本2分词—去停用词统计两篇文章的词频词频向量1和词频向量2相似度的计算分词:例:“…

网页抓取:PHP实现网页爬虫方式小结

抓取某一个网页中的内容,需要对DOM树进行解析,找到指定节点后,再抓取我们需要的内容,过程有点繁琐。LZ总结了几种常用的、易于实现的网页抓取方式,如果熟悉JQuery选择器,这几种框架会相当简单。 一、Ganon …

php中取页面的值_php如何抓取网页上的数据

php中抓取网页内容的实例详解 方法一:使用file_get_contents方法实现$url "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $html file_get_contents($url); //如果出现中文乱码使用下面代码 //$getcontent iconv("gb2312…

关于如何使用PHP抓取网页数据并进行处理的经验

在网络时代,数据是无处不在的。很多时候,我们需要从网页上获取特定的数据,以便进行进一步的处理和分析。而PHP作为一种强大的编程语言,提供了丰富的函数和库来帮助我们实现这个目标。本文将分享一些关于如何使用PHP抓取网页数据并…

php根据URL获得网页内容

php 中根据url来获得网页内容非常的方便&#xff0c;可以通过系统内置函数file_get_contents(),传入url,即可返回网页的内容&#xff0c;比如获得百度首页的内容代码为&#xff1a; <?php $html file_get_contents(http://www.baidu.com/);echo $html; 就可以显示出百度首…