主成分之综合竞争力案例分析

article/2025/5/16 19:26:49

一、案例背景

1.案例说明

研究调查100家公司2010-2013年关于财务方面的具体数据,这些财务指标维度分别为盈利能力、偿债能力、运营能力、发展能力以及公司治理。其中每个维度分别有几个分析项,但是有些指标是越大越好,有些指标是越小越好。 需要在研究前进行数据处理。

2.研究目的

此案例主要目的是利用数据进行主成分分析,最后进行各个公司的主成分排名或者竞争力排名,利用成分得分分析每个公司在2010-2013年对于每个维度的排名情况以及最终的综合得分排名,并找出排名前20的公司。

二、数据处理

主成分的目的就是用少数几个成分去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个成分(之所以称其为成分,是因为它是不可观测的,即不是具体的变量),以最少的信息丢失为前提,以较少的几个成分反映原资料的大部分信息。

在进行主成分之前,由于所选取的指标体系中每个指标都有自己的量纲和变动差异性,这样给综合分析建模带来不便,于是我们需要对收集得到的数据进行预处理,以消除量纲和变动差异性的影响。通常对数据进行的处理包括标准化处理(Z-score 法)、正向处理、均值化处理等。

此案例中有些指标需要提前处理,具体指标隶属维度以及指标性质如下,比如资产负责率是逆向指标可以进行逆向化处理或者取倒数;但是取倒数需要分析项的数据大于0,其他指标需要正向化处理,公司治理的2个指标可以做正向化处理也可以做适度化,比如认为指标不是越大越好也不是越小越好,接近于某个值或某个范围内认为更好那就使用适度化,此案例中认为越大越好处理为正向化(也有参考文献做适度化处理,建议以参考文献为主)。

首先用SPSSAU将分析项进行“描述分析”观察数据的基本情况。发现资产负债率所有数据均大于0,所以进行处理时可以直接“取倒数”。

分析结果来源于SPSSAU

然后利用SPSSAU“数据处理”中的“生成变量”进行指标处理(一般正逆向化处理后不需要在进行标准化处理,因为已经正逆向化已经处理了量纲问题,但是取倒数后需要进行标准化处理)。

三、主成分

主成分结果分为4个部分,判断主成分与分析项对应关系、KMO值和巴特球形检验、成分选择个数以及提取成分。

1.判断主成分与分析项应关系

使用主成分分析进行信息浓缩研究,首先分析研究数据是否适合进行主成分分析,从上表可以看出:KMO为0.642,大于0.6,满足主成分分析的前提要求,意味着数据可用于主成分分析研究。以及数据通过Bartlett 球形度检验(p<0.05),说明研究数据适合进行主成分分析。

成分与对应项之间的关系:

一般情况下,如果16项与5个成分之间的对应关系情况,与专业知识情况不符合,比如第一项被划分到了第一个成分下面,此时则说明可能这项应该被删除处理,其出现了‘张冠李戴’现象。因而在进行分析时很可能会对部分不合理项进行删除处理。除此之外,也有可能会出现‘纠缠不清’现象。

  1. “张冠李戴”

一般情况下,如果16项与5个成分之间的对应关系情况,与专业知识情况不符合,比如第一项被划分到了第一个成分下面,此时则说明可能这项应该被删除处理,其出现了‘张冠李戴’现象。例如案例中的“应收账款周转率”应该属于成分2是分析时被划分到别的成分中。

  1. “纠缠不清”

除了“张冠李戴”现象,有时候会出现‘纠缠不清’现象,比如案例中的“净资产收益率”可归属为成分1,成分2,同时也可归属到成分3,这种情况较为正常(称作‘纠缠不清’),需要结合实际情况处理即可,可将该项删除,也可不删除,这时,分析带有一定主观性。

主成分分析是一个多次重复的过程,比如删除某个或多个题项后,则需要重新再次分析进行对比选择等。最终目的在于:成分与分析项对应关系,与专业知识情况基本吻合。

Step1: 第一次分析

本例子中共16个分析项,此16个分析项共分为5个维度,因此在分析前可主动告诉SPSSAU,此16项是五个维度,否则SPSSAU会自动判断多少个成分 (通常软件自动判断与实际情况有很大出入,所以建议主动设置成分个数)。如下图:

从上图中可以看出:

“流动比率”、“速动比率”以及“资产负债率”这3项,它们全部对应着成分1,公因子方差均高于0.4,说明此3项应该同属于一个维度,即逻辑上这3项,并没有出现 “张冠李戴”现象。但是有出现“纠缠不清”的情况。暂不处理。“应收账款周转率”、“存货周转率”、“总资产周转率”它们对应着成分2,但应收账款周转率共同度小于0.4所以需要删除处理。 “净资产收益率”、“资产报酬率”以及“主营业务利润率”共3项,此3项均对应着成分3,此3项并没有出现‘张冠李戴’问题,但是出现了“纠缠不清”。“第一大股东持股比”和“前十大股东持股比”共2项,它们全部对应着成分4,也没有出现“纠缠不清”的现象。“净利润增长率”、“主营业务收入增长率”、“总资产现金回收率”、“销售现金比率”以及“每股经营性现金流量”共5项,当他们对应成分5, “主营业务收入增长率”、“总资产现金回收率”以及“每股经营性现金流量”出现“张冠李戴”进行删除处理。

总结上述分析可知:“主营业务收入增长率”、“总资产现金回收率”以及“每股经营性现金流量”这三项出现“张冠李戴”,应该将此三项删除;“应收账款周转率”共同度小于0.4需要删除处理,而其他出现“纠缠不清”现象的,暂时不处理(进行关注即可)。重新分析如下。

Step2: 第二次分析

从上图可知 “主营业务利润率”出现‘张冠李戴’现象,应该删除,以及“资产收益率”、“资产报酬率”等出现‘纠缠不清’现象,暂不处理,但应该给予关注。总结可知:应该将“主营业务利润率”先删除后再次进行第3次分析。

Step3: 第三次分析

将“主营业务利润率”删除后进行分析如下:

从上图可知

除了“流动比率”、“速动比率”以及“资产负债率”这3项,“净利润增长率”、“销售现金比率”这两项,其余的项均存在“纠缠不清”的现象,但考虑到成分下只余下两项,因而表示可以接受,主成分析分析结束。

2.KMO值和巴特球形检验

使用主成分分析进行信息浓缩研究,首先分析研究数据是否适合进行主成分分析,从上表可以看出:KMO为0.605,大于0.6,满足主成分分析的前提要求,意味着数据可用于主成分分析研究。以及数据通过Bartlett 球形度检验(p<0.05),说明研究数据适合进行主成分分析。

3.成分选择个数

当数据确定可以使用主成分分析后,下一步确定主成分成分选择个数。利用SPSSAU的主成分中选择主成分分析方法来判断选取的成分个数。成分数目的确定没有精确的定量方法,但常用的方法是借助三个准则来确定成分的个数。一是特征值准则,二是碎石图检验准则,三是专业知识判断法。特征值准则就是选取特征值大于或等于1的主成分作为初始成分,而放弃特征值小于1的主成分。碎石图检验准则是根据成分被提取的顺序绘出特征值随成分个数变化的折线图,根据图的形状来判断成分的个数。折线图的特点是由高到低,先陡后平,最后几乎成一条直线。曲线开始变平的前一个点被认为是提取的最大成分数。专业知识判断法是结合自身专业知识情况,主观判断成分数量。本部分使用特征根值与碎石图判断方式。

方差解释率表格主要用于判断提取多少个主成分合适。以及每个主成分的方差解释率和累计方差解释率情况。方差解释率越大说明主成分包含原数据信息的越多。

上表格针对主成分提取情况,以及主成分提取信息量情况进行分析,从上表可知:主成分分析一共提取出5个主成分,特征根值均大于1,此5个主成分的方差解释率分别是29.083%,18.253%,14.734%,12.376%,11.033%,累积方差解释率为85.479%。(提示:如果主成分提取个数与预期不符,可在分析时主动设置主成分个数)。另外,本次分析共提取出5个主成分,它们对应的加权后方差解释率即权重依次为:29.083/85.479=34.02%;18.253/85.479=21.35%;14.734/85.479=17.24%;12.376/85.479=14.48%;11.033/85.479=12.91%;同时SPSSAU还提供了碎石图帮助研究者判断主成分提取个数。

特征根一般是指标每个成分的贡献程度。此值的总和与项目数匹配,此值越大,代表主成分贡献越大。当然主成分分析通常需要综合自己的专业知识综合判断,即使是特征根值小于1,也一样可以设置成分。在进行主成分分析时,研究者没有预设成分数,系统就会以特征根“大于1”为标准进行划分。可以看出有五个特征根值大于1,提取五个成分是合理的,除了特征根之外SPSSAU还提供了更加直观的碎石图帮助判断。

同时可结合碎石图辅助判断主成分提取个数。当折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。实际研究中更多以专业知识,结合主成分与研究项对应关系情况,综合权衡判断得出主成分个数。

从图中可以看出,横轴表示指标数,纵轴表示特征根值,当提取5个成分时,特征根值变化较明显;当提取5个以后的成分时,特征根变化也相对平稳,对原有变量贡献相对较小,由此可见提5个成分对原变量有的显著作用。碎石图仅辅助决策成分个数,如果由此图分析6个成分也是可以的。

此案例按专业知识来看提取5个成分,如果没有预设成分个数也可以默认让系统进行决策。

4.提取成分

已经确定了成分选择个数经过分析得到载荷系数矩阵如下:

载荷系数表格,主要展示主成分对于研究项的信息提取情况,以及主成分和研究项对应关系。蓝色数值代表载荷系数绝对值大于0.4。共同度代表某题项可被提取的信息量,共同度越高说明指标能被主成分解释的程度越高,被提取的信息量越多。一般以0.4作为标准。

从结果中可以看出,主成分1中反映“流动比率”、“速动比率”以及“资产负债率”共3个指标的信息,它们主要反映了公司的偿债能力。主成分2中反映了“净资产收益率”、“资产报酬率”共2项它们主要反映了公司的盈利能力,主成分3中反映了“第一大股东持股比”和“前十大股东持股比”共2项,它们主要反映了公司治理能力,主成分4中反映了“存货周转率”、“总资产周转率”共2项,它们主要反映了公司运营能力,主成分5中反映了“净利润增长率”、 “销售现金比率”,它们主要反映了公司发展能力。

整理表格如下:五个成分的名字分别叫F1偿债能力、F2盈利能力、F3治理能力、F4运营能力以及F5发展能力。

四、竞争力排名

主成分越大意味着在该成分上竞争力越大,综合得分越高意味着该项公司的综合竞争力水平越强,以及主成分和综合得分在SPSSAU中分析如下。分为主成分排名与竞争力排名两个部分。

主成分排名

成份得分系数矩阵

可直接SPSSAU右上角“我的数据”进行查看成分得分也可以进行下载。

接下来分别输出各个公司在2010-2013年的各成分排名情况(仅展示前20项):

  1. 偿债能力
排序名称偿债能力
1双鹭药业16.41
2千红制药13.03
3华兰生物7.40
4智飞生物6.78
5舒泰神6.20
6大华农5.77
7博雅生物5.39
8上海莱士4.56
9冠昊生物3.78
10金达威3.23
11科华生物3.20
12安科生物2.40
13东阿阿胶2.07
14吉林敖东2.04
15瑞普生物2.03
16四环生物1.77
17星河生物1.38
18通化东宝1.28
19天山生物1.01
20沃森生物0.70

针对公司的盈利能力,利用数据透视表将主成分得分求和,根据数据结果显示最好的是“双鹭药业”其次是“千红制药”前20名如上表显示。

2)盈利能力

排序名称盈利能力
1华润三九7.17
2中牧股份6.81
3上海莱士6.18
4正邦科技5.79
5大北农5.48
6青岛啤酒5.38
7伊力特4.61
8华润双鹤4.45
9天坛生物4.35
10澳柯玛4.03
11悦达投资3.68
12东阿阿胶3.35
13燕京啤酒3.24
14獐子岛3.14
15金种子酒3.08
16科华生物3.03
17万向德农3.03
18光明乳业2.98
19天康生物2.95
20双鹭药业2.95

针对公司的盈利能力,利用数据透视表将主成分得分求和,根据数据结果显示最好的是“华润三九”其次是“中牧股份”前20名如上表显示。

3)治理能力

排序名称治理能力
1诚志股份7.992604
2正邦科技7.153529
3智飞生物6.679127
4美罗药业6.650961
5千红制药4.80757
6光明乳业4.745864
7天康生物3.93622
8舒泰神3.915128
9大北农3.838614
10华润双鹤3.812249
11扬农化工3.253352
12瑞普生物3.20509
13燕京啤酒2.992444
14金达威2.920408
15星河生物2.850168
16四环药业2.731311
17华润三九2.618381
18博雅生物2.598811
19中牧股份2.353754
20申华控股2.292654

针对公司的治理能力,利用数据透视表将主成分得分求和,根据数据结果显示最好的是“诚志股份”其次是“正邦科技”前20名如上表显示。

4)运营能力

排序名称运营能力
1正邦科技9.41
2诚志股份7.50
3双鹭药业6.43
4科华生物5.79
5申华控股5.73
6中粮生化5.39
7沙隆达A4.96
8海王生物4.76
9大北农4.35
10华北制药4.22
11东阿阿胶3.81
12光明乳业3.64
13大华农3.37
14扬农化工3.15
15千红制药3.15
16威远生化2.79
17四环生物2.69
18荣华实业2.45
19新安股份2.45
20啤酒花2.34

针对公司的运营能力,利用数据透视表将主成分得分求和,根据数据结果显示最好的是“正邦科技”其次是“诚志股份”前20名如上表显示。

5)发展能力

排名名称发展能力
1诚志股份6.99
2四环生物4.94
3中源协和4.84
4中粮生化4.32
5正邦科技4.31
6光明乳业4.15
7江苏吴中3.59
8千红制药2.99
9澳柯玛2.94
10青海明胶2.79
11新安股份2.75
12晨光生物2.61
13扬农化工2.42
14海王生物2.39
15威远生化2.01
16荣华实业1.92
17啤酒花1.79
18大华农1.79
19燕京啤酒1.73
20海南海药1.64

针对公司的发展能力,利用数据透视表将主成分得分求和,根据数据结果显示最好的是“诚志股份”其次是“四环生物”前20名如上表显示。

2.竞争力排名

对于“综合得分”SPSSAU提供一键生成综合得分非常方便,可以分析后点击右上角我的数据进行查看,具体计算如下:

综合得分等于每个主成分得分乘以各自权重求和所得的结果。

即为:综合得分F值=a1*F1+a2*F2+a3*F3+a4*F4+a5*F5, ai=Fi的方差解释率/总的方差解释率(i从1到5);求解得到a1到a5的值分别为34.02%,21.35%,17.24%,14.48%,12.91%。

F=34.02%*主成分1得分+21.35%*主成分2得分+17.24%*主成分3得分+14.48%*主成分4得分+12.91%*主成分5得分;

因此最后计算出每个公司的综合得分F值,并得到财务竞争力排名如下表所示(中间过程可用数据透视表处理):

  1. 透视表部分结果如下

  1. 最终结果如下
1双鹭药业1.73114
2千红制药1.726451
3智飞生物1.018631
4博雅生物1.011556
5正邦科技0.987016
6舒泰神0.802011
7金达威0.747585
8华兰生物0.593216
9大华农0.553165
10上海莱士0.525126
11大北农0.499163
12诚志股份0.49584
13星河生物0.391593
14青岛啤酒0.35341
15光明乳业0.346792
16冠昊生物0.330535
17中牧股份0.316433
18金河生物0.282712
19科华生物0.272181
20华润双鹤0.262264

五、总结

此案例对数据进行主成分分析并对成分得分与综合得分进行描述,首先对数据进行处理,使用SPSSAU生成变量功能,然后判断主成分与分析项对应关系,并描述成分选择个数以及提取成分,接下来对竞争力进行排名利用成分得分分析每个公司在2010-2013年对于每个维度的排名情况由于数据过多所以结果只显示前20名的公司,以及具体描述综合得分的计算得到最终的综合得分排名。此次分析结束。


更多干货请前往SPSSAU官网查看。


http://chatgpt.dhexx.cn/article/jKrbsPIy.shtml

相关文章

数据分析,主成分分析例题

已知协方差矩阵求X的各主成分以及主成分的贡献率 主成分分析 原理&#xff1a;找出几个综合变量来代替原来众多的变量&#xff0c;使这些综合变量能尽可能地代表原来变量的信息量&#xff0c;且彼此之间互不相关 统计方法&#xff1a;主成分分析&#xff08;主分量分析&…

主成分分析PCA案例及原理

1. 主成分分析PCA案例 https://blog.csdn.net/goodshot/article/details/78080220 http://www.cnblogs.com/zhangchaoyang/articles/2222048.html 附: 使用上方链接的解释&#xff1a; 2. 主成分分析&#xff08;PCA&#xff09;原理总结http://www.cnblogs.com/pinard/p/623…

主成分分析简单例子

一、数据降维 对于现在维数比较多的数据&#xff0c;我们首先需要做的就是对其进行降维操作。降维&#xff0c;简单来说就是说在尽量保证数据本质的前提下将数据中的维数降低。降维的操作可以理解为一种映射关系&#xff0c;例如函数&#xff0c;即由原来的二维转换成了一维。处…

spss分析方法-主成分分析

spss分析方法-主成分分析&#xff08;转载&#xff09; 主成分分析利用的是“降维”的思想&#xff0c;利用原始变量的线性组合组成主成分。在信息损失较小的前提下&#xff0c;把多个指标转化为几个互补相关的综合指标。下面我们主要从下面四个方面来解说&#xff1a; 实际…

主成分分析案例

去百度文库上一搜&#xff0c;是很老的题目了。这里所做的只是准备工作&#xff0c;为后面更多的数据处理做准备。 例题 1.对原始资料矩阵进行标准化处理 zef_data xlsread(chengshi.xls); z zscore(zef_data) z 1.1977 0.7149 0.6674 1.1390 0.9189 3.111…

快速搞定PCA(主成分分析)(原理 代码 案例)

目录 一、基本介绍 1.1原理 1.2主成分分析的几何解释 1.3主要步骤 1.4主成分个数的选取原则 二、主成分分析代码 2.1MATLAB代码 2.2Python代码 三、实用案例 一、基本介绍 1.1原理 主成分分析是最常用的线性降维方法&#xff0c;通过某种线性投影&#xff0c;将高维的数…

【机器学习】主成分分析实现案例 (PCA)

一、说明 这篇文章的目的是提供主成分分析&#xff08;PCA&#xff09;的完整和简化的解释。我们将逐步介绍它是如何工作的&#xff0c;这样每个人都可以理解并使用它&#xff0c;即使是那些没有强大数学背景的人。 PCA是网络上广泛覆盖的机器学习方法&#xff0c;并且有一些关…

什么是主成分分析?经典案例解析变量降维

1、作用 主成分分析将多个有一定相关性的指标进行线性组合&#xff0c;以最少的维度解释原数据中尽可能多的信息为目标进行降维&#xff0c;降维后的各变量间彼此线性无关&#xff0c;最终确定的新变量是原始变量的线性组合&#xff0c;且越往后主成分在方差中的比重也小&…

比较两篇文章的相似性方法

对于这个题目&#xff0c;开始毫无头绪&#xff0c;后来经过查阅资料现在讲方法总结如下&#xff1a; 1、利用余弦定理 我们知道向量 a,b之间的夹角可用余弦定理求得&#xff1a; 如果夹角的余弦值越小&#xff0c;那么夹角也越大。如果2个向量相等&#xff0c;那么其值为1。利…

Python案例分析|文本相似度比较分析

本案例通过设计和实现有关文本相似度比较的类Vector和Sketch&#xff0c;帮助大家进一步掌握设计Python类来解决实际问题的能力。 01、文本相似度比较概述 通过计算并比较文档的摘要可实现文本的相似度比较。 文档摘要的最简单形式可以使用文档中的k-grams&#xff08;k个连…

计算机如何判断两篇文章相似性

这个仍然是极客时间上&#xff0c;关于《索引技术核心20讲》的一篇笔记同时结合自己的理解加了点料&#xff0c;这个专栏虽然只有20讲&#xff0c;但是真不错&#xff0c;老师解答问题还是很积极&#xff0c;回答字数经常比问题字数多。有兴趣的朋友可以到我星球&#xff08;在…

ai写文章检测原理(文章相似度检测)

小编来了&#xff01;今天要和大家聊一聊关于ai写文章检测原理的评测对比。究竟哪种方法更加高效准确呢&#xff1f;让我们一起来看看吧&#xff01; 概括&#xff1a;本文将从多个角度对ai写文章检测原理进行评测对比&#xff0c;包括算法准确性、速度、自动化程度、用户体验…

【跨语言剽窃检测】文本相似度分析之一

对比文件1&#xff1a; 2010年的跨语言剽窃检测新方法 作者RaFael Corezola Pereira instituion : UFRGS 摘要&#xff1a; 作者提出一个跨语言剽窃检测新方法&#xff0c;分为5个主要阶段&#xff1a; languange normalization、retrieval of candidate documents、classfier …

文本相似度综述

本文目录 文本相似度的定义文本相似度计算方法基于字符串的方法基于语料库的方法基于词袋VSMLSA、PLSALDA&#xff08;需要进一步了解&#xff09; 基于神经网络基于搜索引擎 基于世界知识基于本体基于网络知识 其他方法句法分析混合方法 文本相似度的定义 其中, common&#x…

JAVA-计算两篇文章的相似度

1.场景&#xff1a; 在很多公司的文件管理系统中&#xff0c;都有类似于对比多篇文章的相似度&#xff0c;例如在写公众号推文时&#xff0c;如果标记了原创&#xff0c;就会对比当前文章和库里已存在文章的相似程度&#xff0c;如果相似度过于高&#xff0c;则标记为原创的文章…

免费好用的文章相似度检测软件推荐

相信很多人在写作的时候都会遇到这样的问题&#xff0c;就是怕自己写出的文章被抄袭。为了保证自己的原创性&#xff0c;我们需要使用一些文章相似度检测软件来帮助我们检测文章是否被抄袭。那么&#xff0c;有哪些免费好用的文章相似度检测软件呢&#xff1f;下面就为大家介绍…

判断两篇文章的相似度

判断相似度 基于jieba 关键字提取的方法textrank关键字的提取代码&#xff1a;tf-idf关键字的提取代码&#xff1a;统计数据统计数据的代码&#xff1a;完整代码&#xff1a; 基于jieba 关键字提取的方法 textrank 1&#xff0c;将待抽取关键词的文本进行分词 2&#xff0c;以…

检测文章相似度的方法?文章原创度检测工具免费

免费检测文章相似度的软件&#xff0c;什么是检测文章相似度的软件&#xff0c;简单来说就是原创检测工具&#xff0c;相信不少的朋友都在利用这个功能来检测自己文章的原创度是多少&#xff1f;要做好一篇文章真的只需要检测文章的相似度吗&#xff1f;答案&#xff1a;肯定是…

[将小白进行到底] 如何比较两篇文章的相似度

其实这个题目已经有很多人写过了&#xff0c;数学之美里就有&#xff0c;最近阮一峰的博客里也写了&#xff0c;本文基本上遵循的就是他的思路&#xff0c;只是让其看起来再小白一点点。其实说白了就是用自己的话&#xff0c;再把同样一件事描述一下&#xff0c;顺便扩扩句&…

文本相似度的检测

项目原理 基于词频:统计文章中词频,构建词频特征向量,利用特征向量夹角的余弦值表示文本的相似度。两篇文章最大相似度为1,特征向量夹角为0。 基于词频的文本相似度检测步骤: 文本1和文本2分词—去停用词统计两篇文章的词频词频向量1和词频向量2相似度的计算分词:例:“…