聚类分析在SPSS上的实现与结果分析——基于SPSS实验报告

article/2025/4/23 3:16:23

实验目的

通过本次实验学习聚类分析在SPSS软件中的具体操作方法,包括系统聚类法和K-means聚类这两种方法,同时根据实验目的自己判断方法的适用情况选取最优方法完成聚类分析达到聚类的目的,并做出综合的评价。

实验步骤及过程:

题目一:依菜单选择“分析”→“分类”→“系统聚类”,然后将数据变量导入变量框中,“地区”变量导入到标注个案框中。在“图”选项中勾选系谱图,然后在“方法”中选择不同的聚类方法测试,根据实际聚类效果选择最优方案,这道题我测试得出的最优方法是 “组间距离”(类平均法)“欧式距离”,因为原始数据量纲差异不大,不需要将数据做标准化处理。

 题目二:依菜单选择“分析”→“分类”→“K-均值聚类”,然后将数据变量导入到变量框中,“国家和地区”变量导入到“个案标注依据”中;聚类数一般在2-4之间,根据实际聚类效果反复测试得出3类效果最好,所以聚类数这里输入3;在“选项”中可勾选要统计的聚类信息方便结果分析。

 

题目三:同时采用系统聚类和快速聚类的方法,根据实际结果的情况选择最优方案,这两种具体操作步骤见题目一和题目二。测试结果发现,K-means聚3类的方法和采用 “组间联接”、“欧式距离”的系统聚类方法结果一致,且均为最优聚类方案,所以从便捷快速的角度考虑这里选择采用K-means聚类。


实验结果分析或说明

题目一:

聚类结果如图所示

 

根据聚类结果的效果最终选择使用欧式距离法将31个省份分为了三类(结果保存了变量):

第一类:北京、天津、山西、内蒙古、吉林、黑龙江、上海、安徽、福建、江西、广西、重庆、贵州、云南、陕西、甘肃、新疆

第二类:河北、辽宁、江苏、浙江、山东、河南、湖北、湖南、广东、四川

第三类:海南、西藏、青海、宁夏

将分好组的三类数据求其各项指标的均值观察其特点。 

类别

医疗机构床位数

卫生机构人员数

妇幼保健院

疾病预防控制中心

门诊部诊所

卫生院

医院

第一类

89470.24

141041.94

89.35

106.94

5713.76

1095.41

544.3

第二类

191388.60

312149.60

136.00

153.90

11123.20

2055.4

943.9

第三类

15288.25

25076.5

31

47.75

969.25

403.75

138.5

从图中的数据可以清楚地看出,第二类省、市、自治区的医疗卫生设备总量上处于一个较高的水平,每一项指标均为三类中的最高值,单从总量上来看相对于其他两类第二类样本的医疗卫生设配的条件最好,结合第二类中的具体省、市、自治区发现,第二类样本均为一些中东部的人口、经济大省,例如江苏、浙江、广东、湖北等省,所以其分类结果具有一定的合理性。

第一类样本的医疗设备总量处于一个中等的水平,但是观察其具体样本的数据发现,包含了北京、上海、天津等经济发达地区,观察其原始数据发现其数据总量也不是很大,并且发现四个直辖市均在第一类中,所以这里姑且考虑为医疗卫生设备的总量会受到地域大小的影响。第一类中的其他样本也大多为一些中部、西部发展较为中等的省、市、自治区,例如陕西、甘肃、贵州、云南等省,所以第一类的分类结果也有一定的合理性。

第三类相较而言其医疗设备总量处于一个较低的水平,每项指标的均值都为三类中的最低值,观察其样本数据不难发现,第三类的样本多为西部的欠发达地区,例如西藏、青海,其医疗设备总量上处于一个低水平也得以解释,其分类也较为合理。


题目二:

经过反复测试发现使用K-means聚类分3类的效果最好,聚类结果如下图所示。

 很显然,美国单独分为了第一列与其他样本差别较大,中国、日本、德国分为了第一类,其他国家和地区则是分为了第三类。

 根据最终聚类中心结果得知,第二类样本对外贸易的各项指标基本都处于最高水平,联想到美国当前经济发展水平也不难理解,当今美国仍然是世界上第一大国在对外贸易方面占有着绝对的优势地位,但是其“货物贸易平衡”这一指标却又是这三类中最低水平,甚至为负值,这也许和美国实际的国情有关;

第一类大致处于一个中等片偏上的水平,中国为世界第二大经济体、日本岛国资源的稀缺、 “德国制造”的产品优势这些多多少少都是促使这三个国家成为贸易大国的因素之一,分为一类也不足为奇;

而最后一类,包含了东南亚和欧洲的一些国家,虽说不是组内水平较为平均,但相较另外两组而言这一类的样本与另两组的样本中心点差距还是过大,归为一类也较为合理。


题目三:

聚类结果如下图所示,北京市被单独分为了一类;上海、南京、无锡、苏州、深圳分为了第二类;而其余的省市分为了第三类。

观察各个类各项指标的聚类中心不难发现,北京之所以能单独分为一类,原因在于北京的各项指标均占据着绝对优势的地位,除了“出口总额”这个指标与第二类差距甚微外,其余的指标数值均远超其他类别,同时北京作为我国首都,在政策与历史积淀的作用下经济发展也有着绝对的优势地位;

第二类与第三类差别也存在着显著差异,除了“企业个数”这一指标和第三类差别不大外,其余的各项指标均为碾压状态,而观察样本发现,第二类的样本均为一些经济发展大市,上海和深圳两个经济特区全国前4的GDP贡献率,苏州、南京、无锡这三座城市也基本为全国GDP前十左右的存在,第二类的分类也较为合理;

第三类相较前两类略显后劲不足,考虑到第三类样本较大,样本水平参差不齐平均下来指标数值偏低,但相对于前两类而言差距均较大,分为一类也有一定的合理性。

 


http://chatgpt.dhexx.cn/article/PA8xiMxF.shtml

相关文章

01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析

04 数字图像技术——图像特征提取之实验结果与分析 03 数字图像技术——频域滤波实验结果与分析 02 数字图像技术——颜色空间转换与颜色空间分割实验结果与分析 01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析 一、实验目的和要求 1.掌握Anaconda中搭…

数据分析——AB实验

( 一 ) AB实验概念 AB实验通俗讲就是在线上可以切出一部分用户(降低风险),完全随机的分成两组或多组(确保人群一致),一组保持现有的方案叫对照组,另外一组使用改进的方案…

D型触发器仿真结果分析

1. 1bitD型触发器verilog 程序 2.RTL等效电路图 3.仿真结果 当CLK上升沿的时候,q值变化,就是此时此刻d的数值(高低电平),当上升沿发生在高电平区间,q值就是高电平;当上升沿发生在低电平区间&am…

python实验总结与分析_Python实验报告二

安徽工程大学Python程序设计 班级:物流192 姓名:唐家豪 学号:3190505234 成绩: 日期:2020/3/5 指导老师:修宇 【实验名称】:顺序结构程序设计 【实验目的】 (1)掌握数据的输入输出的方法; (2)熟悉顺序结构程序中语句的执行过程; (3)掌握顺序结构程序…

疲劳测试分析软件,直接使用材料疲劳试验数据进行疲劳分析

疲劳计算需要三个输入:有限元应力/应变的计算结果,材料的疲劳数据,一般是S-N曲线或者E-N曲线。第三个是载荷谱。材料的疲劳数据,通常都是在MSC Fatigue软件自带的材料数据库中找个相同或相近的材料,材料库没有的材料&a…

一阶电路暂态响应的结果分析。_阻尼比测试方法及谐响应分析

谐响应分析中,阻尼比的确定是关键问题,工程中阻尼比经常是估计值,导致分析结果跟实际不符。阻尼对模态频率的影响很小,阻尼的主要作用是压低共振处的幅值,如果阻尼取为0的话,共振处的峰值会相当大,理论上是无穷大。目前阻尼问题研究的不是很透彻,并没有很多的理论支持,…

一阶电路暂态响应的结果分析。_电路之暂态分析

电路之 暂态分析 为什么会出现暂态? 学习了前面直流电路和交流电路的内容,我们似乎觉得这已经覆盖了电路可能存在的各种情况。陌生如电容、电感这种元件,只要将它们插在直流电路里,便是一个断路,一个短路,无比简单。可事实真的如此吗?当直流电路中只有电阻时,我们可以认…

python实验总结与分析_Python实验报告七

安徽工程大学 Python程序设计 实验报告 班级 物流191 姓名倪绍磊学号3190505131 成绩 日期 2020.5.28 指导老师修宇 【实验名称】实验七 组合数据类型 【实验目的】 熟悉通过序列索引迭代执行循环;掌握元组、列表与字典的系列操作函数及相关方法 【实验条件】 PC机或者…

ospf 实验详细分析

Ospf实验 R1-3为区域0,R3到R4为区域1,其中R3的环回也在区域0 R1,2也有环回,R1-3 R3为DR设备,没有BDR R4环回地址已固定,其他所有网段使用192.168.1.0/24进行合理分配 R4环回不能宣告,全网可…

slam结果分析

ubuntu18使用evo工具: 可参考的链接 官方描述 1、安装 1)依赖项 sudo apt-get install tcl-dev tk-dev python3-tk2)pip安装 sudo pip install evo --upgrade --no-binary evo2、使用(主要指kitti) 根据地面真实数据…

判别分析在SPSS上的实现与结果分析——基于SPSS实验报告

实验目的 通过本次实验学习判别分析在SPSS软件中的具体操作方法,依据变量的各个特征来对变量进行分组,与聚类分析不同的是判别分析对于类别是已知的。 实验步骤及过程: 首先对14组数据做聚类分析,通过快速聚类法分为3类作为判别…

YOLOv5训练结果分析

本文的目的是帮助理解每次训练后,在runs/train文件夹下出现的一系列文件,并探索如何评估准确率以及模型的好坏。 一.混淆矩阵—confusion_matrix.png 毕设跑的train有混淆矩阵,但是有点扯,需要跑一下鸟类的验证一下(待验证) 1.概…

【科研分享】Matplotlib 绘制热力图(heatmap)进行实验结果分析

Matplotlib 绘制热力图(heatmap)进行实验结果分析 写论文的时候又碰到了新的需求,为了呈现实验结果,这次需要做一个分析两个超参的图,搜了半天发现还是热力图最合适,但是在各处看了很多篇文章发现讲的要么不…

实验结果分析

为了说明本文所提出基于深度学习的SIR模型方法的性能,我们比较了闭集合(Close-set Dataset)数据和开集合(Open-set Dataset)数据两种情景下的已确诊Covid19病例的数量的预测值。模型的闭集合数据内拟合是模型估计潜在参数的有效性的重要指标,而开集合数据…

主成分分析在SPSS上的实现与结果分析——基于SPSS实验报告

实验目的 通过本次实验学习主成分分析在SPSS软件中的具体操作方法,更深入了解主成分分析法的基本思想,通过SPSS的实现将理论运用于实践当中,增强我们的动手能力并且会运用主成分分析的方法来处理数据实现我们的需求。 实验步骤及过程&#x…

03 数字图像技术——频域滤波实验结果与分析——python

04 数字图像技术——图像特征提取之实验结果与分析 03 数字图像技术——频域滤波实验结果与分析 02 数字图像技术——颜色空间转换与颜色空间分割实验结果与分析 01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析 一、实验目的 1.了解图像…

将两张图片合并成一个PDF,不收费

如何来实现将两张图片合并成一个PDF? 我试过WPS金山、Adobe、万兴等等PDF软件,他们NND都是要收费! 咱也不是钱多到大水飘过来的,这里给出最简单的方式,用Windows自带的打印功能,就能实现! 最重要的是&…

pdf转高清图片

很多人在java中遇到ppt/pdf转图片的时候,有些插图图片转不了或者是转出来的图片不清晰,也都是使用的官方jar包。有些是需要引用到icepdf插件的,这里不细说了,直接放一段稍微简单一点的代码供参考: package test;impor…

锐化pdf文件(图片形式)

目录 前言 正文 1、使用PDF Shaper Pro拆分pdf 2、使用ComicEnhancerPro处理拆分好的图片 3、使用PDF Shaper Pro合并图片为pdf 前言 最近复习考研数学,然后买书真的是死贵死贵,第一次把网上找到的pdf打印出来后发现非常的不清晰,然后开…

利用C#实现Pdf转图片

这周碰到一个需求,由于公司系统框架的原因,不能直接显示第三方回传回来的pdf(说明一下,第三方回传的pdf是带上了签章信息(即在pdf中加入了签名图片)),需要把pdf转成图片进行显示,但在做的过程中踩了不少雷。最后使用第…