【计量模型整理】偏最小二乘回归 PLS

article/2025/10/7 13:28:38

partial least square PLS

    • 原理
    • 与MLS、PCR、MRA比较
    • 适用情况
    • 数学推导与软件实现
    • 参考文献

原理

在影响因变量的大量的因素中,会存在隐形的影响因素但却具有很强的解释力,PLS的基本思想是提取这些隐性因素去代表尽可能多的变量来解释因变量。因而PLS也被称作“projection to latent structure.”

具体过程见下图的上部分,实际上是从factor中提取出因子T(x-scores),而后通过T去得出预测项U(y-scores) ,使用y-scores去建立对因变量的预测值。PLS类似于robust的RDA(Redundancy Analysis)分析(方法对比见后文)。

PLS也需要确定所选因子的数量,但可以通过基于残差方差的heuristic technique或选择使总预测误差最小的因子数。

PLS和标准模型对比,图片来源:PLS和原本的影响结构参考文献[1]

The extracted factors T (also referred to as X-scores) are used to predict the Y-scores U , and then the predicted Y-scores are used to construct predictions for the responses. This procedure actually covers various techniques, depending on which source of variation is considered most crucial.

与MLS、PCR、MRA比较

MLS(多元回归分析) 当变量大于样本数时,会出现 over-fitting 的情况,模型拟合优度极高,但模型本身会丧失预测的能力。
当提取的因子数量大于或等于样本因子矩阵的秩,则PLS与MLR的结果相等

从PLS的定义中,可以看出PLS与主成分分析类似,但存在一定的区别:

  • 1.主成分分析(PCR): 从自变量中选择对因变量解释力度最高的主成分(x-score),对预测值没有进行变化。

    同时,相似的方法还有RDA (Randall D在文中用了MRA做了类比)

  • 2.最大冗余分析(Maximum Redundancy Analysis): 选取对因变量预测值解释力度最高的部分(y-score)。

    • 事实上,RDA类似于一个约束的主成分分析,其对Y的拟合值(预测值)进行了一次主成分分析,提取出被解释变量的主成分,再找影响这一主成分的解释变量或解释变量的主成分。(细节见参考文献2或 Legendre和Legendre(1998)以及ter Braak(1994))
    • RDA的方法主要用于被解释变量(响应变量)个数较多时,多出现在生态计量学的分析中。

从计算方法来看,PCA、RDA与PLS在方法上的区别在于,PCA是对XX进行特征分解,RDA是对YhatYhat进行特征分解,而PLS是对XY进行奇异值分解。

适用情况

1.因子较多且共线性较高

Partial least squares (PLS) is a method for constructing predictive models when the factors are many and highly collinear.

2.侧重对因变量的预测而不是考察变量间的关系

Note that the emphasis is on predicting the responses and not necessarily on trying to understand the underlying relationship between the variables.

数学推导与软件实现

推导过程和MATLAB实现见 参考文献 [3]
Stata实现见 Sergio Venturini & Mehmet Mehmetoglu, 2017 和 Mikko Rönkkö, 2015
R实现见 Introduction to the pls Package

参考文献

[1] An Introduction to Partial Least Squares Regression Randall D. Tobias, SAS Institute Inc., Cary, NC
[2] 数量生态学笔记||冗余分析(RDA)概述
[3] 【建模应用】PLS偏最小二乘回归原理与应用


http://chatgpt.dhexx.cn/article/vaRGyla0.shtml

相关文章

MATLAB中的偏最小二乘回归(PLSR)和主成分回归(PCR)

通过Matlab示例来解释偏最小二乘的原理 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性。 当存在大量预测变量时,PLSR和PCR都是对因变量建模的方法&#…

数学建模之偏最小二乘回归分析

EverydayOneCat 💯💯! 知识点 1.偏最小二乘回归介绍 偏最小二乘回归(PLS-Partial Least Squares)是一种新型的多元统计数据分析方法,是一种多因变量对多自变量的回归建模方法,是对最小二乘方法的推广。 优点: 1)提供了一种多因变量对多自变量的回归建模方法; 2)…

傻瓜攻略(十二)——MATLAB实现偏最小二乘回归PLS

这一定是一篇真正的傻瓜攻略,原理为根,算法为骨,应用为肉,傻瓜为皮。 本文主要介绍偏最小二乘回归的基本实现,主要内容基于司守奎《数学建模算法与应用》第11章,在其基础上进行优化。 偏最小二乘回归分析 …

R语言 偏最小二乘回归PLS代码

导入数据集,标准化变量 library(pls) #读取数据赋值 df read.csv("soil.csv") y scale(df$soil.som) #标准化 x scale(df[,2:50]) #标准化 soil.plsr plsr(y~x,validation "CV") #使用交叉验证确定主成分 summary(soil.plsr) plot(RMS…

MATLAB数值分析学习笔记:线性最小二乘回归

目录 问题引入 数学描述 数学实现 最大似然原理(The Principle of Maximum Likelihood) 代码实现 问题求解: 非线性关系的线性化 问题求解 代码实现 结果 内置函数 示例(求解“问题引入”) 练习题&#xff…

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

偏最小二乘回归是一种回归形式 。 当使用pls时,新的线性组合有助于解释模型中的自变量和因变量。 最近我们被客户要求撰写关于偏最小二乘回归的研究报告,包括一些图形和统计输出。 在本文中,我们将使用pls预测“收入”。 library(Ecdat…

偏最小二乘回归 Matlab

什么是偏最小二乘回归? 偏最小二乘回归(英语:Partial least squares regression, PLS回归)是一种统计学方法,与主成分回归有关系,但不是寻找响应变量和自变量之间最大方差超平面,而…

偏最小二乘回归预测(MATLAB源码)

偏最小二乘回归(英语:Partial least squares regression, PLS回归)是一种统计学方法,与主成分分析有关系,但不是寻找响应变量和自变量之间最大方差的超平面,而是通过投影分别将预测变量和观测变…

MATLAB-偏最小二乘回归分析

偏最小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用偏最小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。 偏最小二乘回归分析在建模过程中集中了主成分分析,典…

MATLAB实现偏最小二乘回归PLS

这一定是一篇真正的傻瓜攻略,原理为根,算法为骨,应用为肉,傻瓜为皮。 本文主要介绍偏最小二乘回归的基本实现,主要内容基于司守奎《数学建模算法与应用》第11章,在其基础上进行优化。 偏最小二乘回归分析 …

第10章 最小二乘线性回归分析

目录 10.1简单线性回归分析 1.描述性统计分析 2.对数据进行相关性分析 3.对数据进行回归分析的结果 4.变量的方差-协方差矩阵 5.对变量系数的假设检验结果 6.对因变量的拟合值的预测 7.回归分析得到残差序列 案例延伸 1.在回归方程中不包含常数项 2.限定参与回归的样…

普通最小二乘(OLS)回归

口译: (Interpreting:) OLS (Ordinary Least Squared) Regression is the most simple linear regression model also known as the base model for Linear Regression. While it is a simple model, in Machine learning it is not given much weightage. OLS is one such mo…

最小二乘法:求回归直线方程

最小二乘法:使离差平方和 (i1~n) ∑(yi-yi) 最小的方法 结论:设回归方程为ybxa;解得 回归直线方程:在一组具有相关关系的变量与数据的(x,y)间&#xff0…

最小二乘回归

最小二乘法(Least squares又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟…

离线安装IE 11

转自:http://blog.sina.com.cn/s/blog_711ab1b10102wzq1.html 1、在D盘下,新建文件夹,取名为“ie”。 2、将官网下载的IE11离线包放到此文件夹中。 3、为了后续步骤方便,可以将离线包重命名为IE11.exe。 4、打开cmd窗口&#xff0…

Microsoft Edge离线安装包下载

#Microsoft Edge 现已准备就绪 下一版 Microsoft Edge 已准备好进行企业评估。 立即下载离线安装程序、查看管理策略并尝试 Internet Explorer 模式。 下载链接

安装IE11提示“Internet Explorer在安装前需要更新”

在Windows 7上安装IE11浏览器时,发现如下报错提示: 此问题一般会出现在未安装过更新的windows系统上,一般可以通过系统更新安装补丁的方式来解决,但是系统自带的更新会按照发布顺序将所有微软发布的补丁都安装上,耗费…

安装ie11提示计算机安装了更新的版本,离线安装IE11浏览器提示quot;获取更新quot;解决方法 - 191路由网...

原标题:"Win7系统离线安装IE11浏览器提示"获取更新"如何解决?"相关电脑问题教程分享。 - 来源:网络投稿。  Win7系统离线安装IE11时出现提示“获取更新”如何解决?IE11浏览器是目前IE浏览器已知最高的版本,…

electron离线安装

公司因为安全原因,导致连不上npm的镜像,查找了资料,终于找到一种离线安装 electron 全局开发环境的方法,分享并记录一下: ps: 如果能用淘宝镜像,直接设置npm config set ELECTRON_MIRROR https://npm.taobao.org/mirr…

chrome浏览器离线安装包下载地址

在谷歌官网下载的chrome浏览器,下载的是安装器,要通过联网安装,谷歌浏览器官网:https://www.google.com/intl/zh-CN/chrome/https://www.google.com/intl/zh-CN/chrome/ 最新版本的统一下载链接,通过以下链接下载的都是…