因子分析模型(主成分解)、及与主成分分析模型的联系与区别(附详细案例)

article/2025/5/16 22:19:24

* * *  precision * logic * efficiency  * * *

因子分析是主成分分析的推广和发展,它也是多元统计分析中将为的一种方法. 因子分析是研究相关阵和或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系.
因子分析的思想一般认为始于Charles Spearman 于1904年发表的文章,他提出用这种方法来解决智力测验得分的统计分析. 目前因子分析在心理学、医学、地质学和经济学等领域都取得了成功的应用。

* * *  * * *

导航

1  正交因子模型

    1.1  模型设定

    1.2  模型假设

    1.3  模型求解

2  因子分析模型与主成分分析模型的联系与区别

3  具体案例

* * *  * * *

1    正交因子模型

1.1   模型设定

设有p维列向量

X=(x_{1},\cdots x_{n})'

为标准化(Z-score)后原有可观测指标向量. 因子分析希望对于每个变量 x_{i} ,用m个公共因子 f_{j} 来解释,即

x_{i}=a_{11}f_{1}+a_{12}f_{2}+\cdots +a_{1m}f_{m}+\varepsilon _{i}

上式用矩阵表示为

X=AF+\varepsilon  ,  其中A为(p×m)的矩阵

\varepsilon 为X的特殊因子,代表了前面m个因子之外剩余因子之和;a_{ij} 为第 i 个变量在第 j 个因子上的载荷.

1.2   模型假设

  每个变量存在四阶原点矩,即 X 存在相关系数矩阵 \Sigma
  E( \varepsilon )= 0, 特殊因子 \varepsilon _{i} 之间、与公共因子不相关,即有
Var(\varepsilon )=diag(\sigma _{1}^{2},\cdots ,\sigma _{n}^{2})=(define)=D;cov(F,\varepsilon )=\mathbf{0}_{(p\times m)}
•  E( F )= 0 , Var( F )= I 即个主成分之间互相独立.

1.3  模型求解(矩阵的谱分解相关知识可点击参见我的另一篇文章

相比主成分分析,因子分析更倾向于描述原始变量之间的相关关系,因此因子分析的出发点就是原始变量的相关系数矩阵 \Sigma ,根据定义有

\Sigma =Var(X)=E[(X-E(X)(X-E(X)'] =E[(AF+\varepsilon )(AF+\varepsilon )']

=A\cdot Var(F)A'+Var(\varepsilon )=AA'+D

 同时

cov(X,F)=E(X-E(X))(F-E(F))'=E[(X-E(X))F']

=E[(AF+\varepsilon )F']=AE(FF')+E(\varepsilon F')=A

上述两式称为正交因子模型的协方差结构,它将相关系数矩阵分解成XF的协方差矩阵的乘积,受此启发,可以求出原始变量的相关系数矩阵 \Sigma 的谱分解式

\sum =\sum_{i=i}^{p}\lambda _{i}a_{i}a_{i}'

为了使上式符合正交因子模型的假定,谱分解式中特征值 \lambda _{i} 对应的特征向量 a_{i} 选为标准正交向量,同时 \Sigma 为对称矩阵,故当省略掉的最后 p-m 个特征值较小的时候,\Sigma 可近似分解为

\Sigma \approx \lambda _{1}a_{1}a_{1}'+\cdots +\lambda _{m}a_{m}a_{m}'+D

=(\sqrt{\lambda _{1}}a_{1},\cdots ,\sqrt{\lambda _{m}}a_{m})\begin{pmatrix} \sqrt{\lambda _{1}}a_{1}\\ \vdots \\ \sqrt{\lambda _{m}}a_{m} \end{pmatrix}+\begin{pmatrix} \sigma _{1}^{2} & & 0\\ & \ddots & \\ 0& &\sigma _{p}^{2} \end{pmatrix}

=AA'+D

其中

\left\{\begin{matrix} A=(\sqrt{\lambda _{1}}a_{1},\cdots ,\sqrt{\lambda _{m}}a_{m})=(define)=(a_{ij})_{p\times m}\\\sigma _{i}^{2}=\Sigma _{it} -\sum_{t=1}^{m}a_{it}^{2}, (i=1,\cdots ,n)\end{matrix}\right.

上式给出的AD就是因子模型的一个解. 因子载荷矩阵A中的第j列(即第j个公共因子 F_{j} 在X上的载荷)和X的第j个主成分的系数相差一个倍数 \sqrt{\lambda _{j}},j=1,\cdots ,m ,故上式给出的解通常称为因子模型的主成分解.

因子个数m的确定原则,一般由实际情况或相关准则确定

\frac{\lambda _{1}+\cdots +\lambda _{m}}{\lambda _{1}+\cdots +\lambda _{m}+\cdots +\lambda _{p}}\geq 80% 或某下限值

2  因子分析模型与主成分分析模型的联系与区别

(今天来不及写了、很快补上

3  具体案例

(今天来不及写了、很快补上

* * *   分享 * 交流  :-)   * * *


http://chatgpt.dhexx.cn/article/8yZfAqvF.shtml

相关文章

PCA主成分分析实战案例

遇到的问题: X df.loc[:,0:4].values#提取第0-3列 y df.loc[:,4].values #提取第4列报错: TypeError: cannot do slice indexing on Index with these indexers [0] of type int修改代码为: X df.iloc[:,0:4].values#提取第0-3列 y df…

主成分分析法概述、案例实例分析

http://hi.baidu.com/weizican/blog/item/9e816926f2977521d5074257.html 主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑…

清风数学建模学习笔记——主成分分析(PCA)原理详解及案例分析

主成分分析 本文将介绍主成分分析(PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。 一般来说,当…

多元统计及R语言案例分析 (主成分和因子分析对学生成绩神秘联系分析)

嗨喽! 大家好,我是“流水不争先,争得滔滔不绝”的翀,18双非本科生一枚,正在努力!欢迎大家来交流学习,一起学习数据分析,希望我们一起好好学习,天天向上,目前是小社畜一枚…

超详细SPSS主成分分析计算指标权重(一)

一、指标权重计算确定的困惑 相信很多写过或者正在写指标处理类论文的朋友都曾对如何计算指标权重充满困惑,到底是用熵值法,还是主成分分析法?或者其他各种看起来奥妙无穷却难以上手操作的神奇方法?好不容易确定要选用主成分分析…

一文读懂 主成分分析 与 因子分析

2023-2-20更新:  修改了一些文字错误,优化了排版,增加了一些拓展内容,祝大家学业有成!(期待三连😁😁) 目录 一、 主成分分析二、因子分析三、多元共线性问题简介3.1 多…

主成分之综合竞争力案例分析

一、案例背景 1.案例说明 研究调查100家公司2010-2013年关于财务方面的具体数据,这些财务指标维度分别为盈利能力、偿债能力、运营能力、发展能力以及公司治理。其中每个维度分别有几个分析项,但是有些指标是越大越好,有些指标是越小越好。…

数据分析,主成分分析例题

已知协方差矩阵求X的各主成分以及主成分的贡献率 主成分分析 原理:找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,且彼此之间互不相关 统计方法:主成分分析(主分量分析&…

主成分分析PCA案例及原理

1. 主成分分析PCA案例 https://blog.csdn.net/goodshot/article/details/78080220 http://www.cnblogs.com/zhangchaoyang/articles/2222048.html 附: 使用上方链接的解释: 2. 主成分分析(PCA)原理总结http://www.cnblogs.com/pinard/p/623…

主成分分析简单例子

一、数据降维 对于现在维数比较多的数据,我们首先需要做的就是对其进行降维操作。降维,简单来说就是说在尽量保证数据本质的前提下将数据中的维数降低。降维的操作可以理解为一种映射关系,例如函数,即由原来的二维转换成了一维。处…

spss分析方法-主成分分析

spss分析方法-主成分分析(转载) 主成分分析利用的是“降维”的思想,利用原始变量的线性组合组成主成分。在信息损失较小的前提下,把多个指标转化为几个互补相关的综合指标。下面我们主要从下面四个方面来解说: 实际…

主成分分析案例

去百度文库上一搜,是很老的题目了。这里所做的只是准备工作,为后面更多的数据处理做准备。 例题 1.对原始资料矩阵进行标准化处理 zef_data xlsread(chengshi.xls); z zscore(zef_data) z 1.1977 0.7149 0.6674 1.1390 0.9189 3.111…

快速搞定PCA(主成分分析)(原理 代码 案例)

目录 一、基本介绍 1.1原理 1.2主成分分析的几何解释 1.3主要步骤 1.4主成分个数的选取原则 二、主成分分析代码 2.1MATLAB代码 2.2Python代码 三、实用案例 一、基本介绍 1.1原理 主成分分析是最常用的线性降维方法,通过某种线性投影,将高维的数…

【机器学习】主成分分析实现案例 (PCA)

一、说明 这篇文章的目的是提供主成分分析(PCA)的完整和简化的解释。我们将逐步介绍它是如何工作的,这样每个人都可以理解并使用它,即使是那些没有强大数学背景的人。 PCA是网络上广泛覆盖的机器学习方法,并且有一些关…

什么是主成分分析?经典案例解析变量降维

1、作用 主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小&…

比较两篇文章的相似性方法

对于这个题目,开始毫无头绪,后来经过查阅资料现在讲方法总结如下: 1、利用余弦定理 我们知道向量 a,b之间的夹角可用余弦定理求得: 如果夹角的余弦值越小,那么夹角也越大。如果2个向量相等,那么其值为1。利…

Python案例分析|文本相似度比较分析

本案例通过设计和实现有关文本相似度比较的类Vector和Sketch,帮助大家进一步掌握设计Python类来解决实际问题的能力。 01、文本相似度比较概述 通过计算并比较文档的摘要可实现文本的相似度比较。 文档摘要的最简单形式可以使用文档中的k-grams(k个连…

计算机如何判断两篇文章相似性

这个仍然是极客时间上,关于《索引技术核心20讲》的一篇笔记同时结合自己的理解加了点料,这个专栏虽然只有20讲,但是真不错,老师解答问题还是很积极,回答字数经常比问题字数多。有兴趣的朋友可以到我星球(在…

ai写文章检测原理(文章相似度检测)

小编来了!今天要和大家聊一聊关于ai写文章检测原理的评测对比。究竟哪种方法更加高效准确呢?让我们一起来看看吧! 概括:本文将从多个角度对ai写文章检测原理进行评测对比,包括算法准确性、速度、自动化程度、用户体验…

【跨语言剽窃检测】文本相似度分析之一

对比文件1: 2010年的跨语言剽窃检测新方法 作者RaFael Corezola Pereira instituion : UFRGS 摘要: 作者提出一个跨语言剽窃检测新方法,分为5个主要阶段: languange normalization、retrieval of candidate documents、classfier …