如何处理多重共线性问题

article/2025/9/19 23:56:37

一、说明

当回归模型中两个或者两个以上的自变量高度相关(比如相关系数大于0.7)时,则称为多重共线性。虽然在实际分析中,自变量高度相关是很常见的,但是在回归分析中存在多重共线性可能会导致一些问题,比如相关分析是负相关回归分析时影响关系是正影响等,所以针对多重共线性问题需要去解决。

二、判断标准与处理办法

1.判断标准

那么如何去解决多重共线性问题?首先对多重共线性的常见判断标准进行说明:

一般有3种方法可以检测多重共线性。

  1. 较常使用的是回归分析中的VIF值,VIF值越大,多重共线性越严重。一般认为VIF大于10时(严格是5),代表模型存在严重的共线性问题。
  2. 有时候也会以容差值作为标准,容差值=1/VIF,所以容差值大于0.1则说明没有共线性(严格是大于0.2),VIF和容差值有逻辑对应关系,两个指标任选其一即可。
  3. 除此之外,直接对自变量进行相关分析,查看相关系数和显著性也是一种判断方法。如果一个自变量和其他自变量之间的相关系数显著,则代表可能存在多重共线性问题。

2.处理办法

多重共线性是普遍存在的,通常情况下,如果共线性情况不严重(VIF<5),不需要做特别的处理。如存在严重的多重共线性问题,可以考虑使用以下几种方法处理:

(1)手动移除出共线性的变量

先做下相关分析,如果发现某两个自变量X(解释变量)的相关系数值大于0.7,则移除掉一个自变量(解释变量),然后再做回归分析。此方法是最直接的方法,但有的时候我们不希望把某个自变量从模型中剔除,这样就要考虑使用其他方法。

(2)逐步回归法

让系统自动进行自变量的选择剔除,使用逐步回归将共线性的自变量自动剔除出去。此种解决办法有个问题是,可能算法会剔除掉本不想剔除的自变量,如果有此类情况产生,此时最好是使用岭回归进行分析。

(3)增加样本容量

增加样本容量是解释共线性问题的一种办法,但在实际操作中可能并不太适合,原因是样本量的收集需要成本时间等。

(4)岭回归

上述第1和第2种解决办法在实际研究中使用较多,但问题在于,如果实际研究中并不想剔除掉某些自变量,某些自变量很重要,不能剔除。此时可能只有岭回归最为适合了。岭回归是当前解决共线性问题最有效的解释办法。

三、案例说明

一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。(案例参考来源:统计学 第7版 中国人民大学出版社)为了弄清不良贷款形成原因,管理者希望利用银行业务的有关数据进行分析,以便参考不良贷款对该银行所属的25家分行进行分析发现自变量之间存在较高的相关性,因而查看vif值发现存在多重共线性,案例选择岭回归模型进行处理。具体分析如下:

四、判断多重共线性

该案例利用相关分析和检验VIF值两个方面进行验证多重共线性。首先进行相关分析以及进一步查看VIF值。

1.相关分析

从图片上来看“各项贷款余额”与“贷款项目个数”、“本年固定资产投资额”以及“贷款项目个数”与“本年固定资产投资额”高度相关相关系数都分别约为0.848、0.780以及0.747都大于0.7,说明可能存在共线性问题进一步查看vif值进行确定。

2.VIF值

从结果中可以看出,分析项中VIF值存在大于5的现象从严格意义来讲存在多重共线性,并且相关分析发现自变量之间存在较高的相关性。如果研究者也遇到此类问题,结果并不影响分析则不需要处理。所以该案例分析场景认为存在多重共线性,因为不想剔除自变量所以使用岭回归更合适。用岭回归进行分析后就不需要担心共线性的问题了。

五、岭回归

首先岭回归分析前需要结合岭迹图确认K值。首先拖拽分析项到分析框,不输入K值,SPSSAU会默认生成岭迹图,同时给出智能分析建议。

图中可以看到,当K值为0.99时,此时自变量的标准化回归系数趋于稳定,因而SPSSAU建议设置最佳K值取为0.99。

本案例中K值取0.99,返回分析界面,输入K值,得出岭回归模型估计。输出结果如下:

从模型效果和模型结果两个方面进行说明:其中模型效果包括F检验和模型拟合优度。

  1. 模型效果

首先对F检验进行查看与说明。

  1. F检验

回归方程的显著性检验中,统计量F=9.757,对应的p值小于0.05,通过检验,说明模型显著。然后对模型拟合优度进行简单查看。

(2)拟合优度

从上表可以看出,模型R方值为0.661,意味着各项贷款余额, 本年累积应收贷款, 贷款项目个数, 本年固定资产投资额可以解释不良贷款的66.12%变化原因。说明模型拟合较好,接下来对模型结果进行分析。

  1. 模型结果

接下来对模型结果进行分析。其中包括模型公式,分析结果以及影响关系及大小。

  1. 模型公式与结果


从上表可知,
模型公式为:不良贷款(亿元)=-0.159 + 0.012*各项贷款余额(亿元) + 0.126*本年累积应收贷款(亿元) + 0.066*贷款项目个数 + 0.004*本年固定资产投资额(亿元)。
模型的结果为:
各项贷款余额、本年累积应收贷款、贷款项目个数三个自变量p值均小于0.05,具有显著性差异,而本年固定资产投资额p值为0.418大于0.05,不具有统计学意义。

  1. 影响关系及大小

如果说自变量X已经对因变量Y产生显著影响(P<0.05),还想对比影响大小,建议可使用标准化系数值的大小对比影响大小,上图所示,显著的自变量中,各项贷款余额、本年累积应收贷款、贷款项目个数的标准化系数分别为0.264、0.220、0.157。所以各项贷款余额标准化系数最大,进而看出模型中各项贷款余额对不良贷款影响较大。

六、结论

通过对数据进行简单查看,发现数据具有多重共线性所以对数据进行处理,处理的方式选择岭回归,对岭回归分模型效果和模型结果两个方面进行阐述,最后得到公式为:不良贷款(亿元)=-0.159 + 0.012*各项贷款余额(亿元) + 0.126*本年累积应收贷款(亿元) + 0.066*贷款项目个数 + 0.004*本年固定资产投资额(亿元)。以及管理者进行决策时可以多关注“各项贷款余额”这个指标。


更多干货请登录SPSSAU官网进行查看。


http://chatgpt.dhexx.cn/article/cJCXSyXF.shtml

相关文章

谈多重共线性

谈多重共线性 本文主要讨论古典假定中无多重共线性被违反的情况&#xff0c;主要情况包括多重共线性的实质和产生的原因、后果、检验方法及无多重共线性假定违反后的处置方法。 第一节 什么是多重共线性 一、多重共线性的含义 讨论多元线性回归模型的估计时&#xff0c;强调…

多重共线性详解

目录 解释变量与自变量&#xff0c;被解释变量与因变量 1、多重共线性的现象 2、出现的原因 3、判别标准 4、检验方法 5、多重共线性有什么影响 6、多重共线性处理方法 7、其他说明 8、多重共线性识别-python代码8.1、vif检验8.2 相关系数8.3 聚类 9、宏观把握共线性问题9.1、共…

浅谈共线性的产生以及解决方法(中篇——今生)

浅谈共线性的产生以及解决方法(中篇——今生) 上篇我们讲到共线性概念以及共线性问题存在时对模型的影响。那么如何对样本数据中存在的共线性问题进行诊断呢&#xff1f; 3 多重共线性的诊断方法 3.1 相关系数法 对于一个样本数据集&#xff0c;我们要了解解释变量&#xf…

共线性那些事儿

我们经常听说&#xff0c;建模时应当尽量避免共线性&#xff08;collinearity&#xff09;&#xff0c;共线性会导致参数估计不稳定、模型不可靠等等。那么共线性究竟有多可怕&#xff1f;共线性具体会带来什么问题&#xff1f;共线性得到的模型是否真的不行&#xff1f;笔者通…

多元线性模型中共线性产生的原因解析

在很多书籍中谈到了共线性问题&#xff0c;作为多元统计中基本假设之一&#xff0c;却经常被违背&#xff0c;影响模型稳定性和统计power。在不少的论文中谈到了&#xff0c;国内的很多书籍往往一笔带过。因为&#xff0c;属于统计计算领域内容&#xff0c;非专业人士&#xff…

好好谈谈共线性问题

好好谈谈共线性问题 马东什么 算法工程师 8 人 赞同了该文章 共线性&#xff0c;即 同线性或同线型。统计学中&#xff0c;共线性即 多重共线性。 多重共线性&#xff08;Multicollinearity&#xff09;是指线性回归模型中的解释变量之间由于存在精确 相关关系或高度相关关系而…

树莓派中SIM7600G-H 4G DONGLE模块使用记录(一)PPP拨号上网/4G上网

项目场景&#xff1a; 如何使用SIM7600系列的4G通信模块进行PPP网上拨号以实现4G通信&#xff0c;在讲解前&#xff0c;未搭建好树莓派远程连接桌面的读者可以先转向树莓派4B环境搭建电脑远程连接打开文件管理闪退(上)。 模块简介&#xff1a; SIM7600X 4G DONGLE是一款工业级…

Linux系统下使用4G模块EC20实现拨号上网

驱动的实现过程 实现4G功能分为两步,第一步内核能成功识别出该设备,第二步实现拨号上网.最后提一下自带的定位功能 一.添加内核USB驱动 这里直接使用内核已经存在的USB驱动,只需要让内核能识别出该USB设备,并自动加载驱动生成对应的/devUSB*设备节点 获取EC20的PID和VID 把模块…

4G模块适配与调试

笔记目录 RK平台4G模块适配1、识别VID、PID2、添加VID\PID到android的option驱动中3、插上sim卡&#xff0c;4G模块一定要接上天线4、根据安卓系统和安卓版本发给模块厂要求其提供ril库5、预置ril库6、在framework中添加根据pid和vid关联ril库的代码7、可以通过一下命令查看ril…

Linux 4G模块pppd拨号上网脚本解析

在编写脚本之前&#xff0c;要先安装好ppp相关驱动&#xff0c;pppd 已知pppd位于 /usr/sbin , chat 位于 /usr/sbin , options 位于 /etc/ppp 。 要编写脚本&#xff0c;就要切换目录到 /etc/ppp/peers&#xff0c;若没有peers目录则自行创建。因为是在/etc目录之下&#xf…

4G模块的使用

一、&#xff14;G相关知识 4G是第四代通讯技术。能够传输高质量视频图像。4G的下载速度达100Mbps&#xff0c;比目前的拨号上网快2000倍&#xff0c;上传的速度也能达到20Mbps&#xff0c;并能够满足几乎所有用户对于无线服务的要求。此外&#xff0c;4G可以在DSL和有线电视调…

4G模块使用总结

4G模块使用总结 一、APN名称 2G: 移动的CMWAP 联通的UNIWAP 移动的CMNET 联通的UNINET 3G/4G: 移动CMNET 联通3GNET 电信CTNET 二、模块信息参数获取 AT/r //检测串口通信状态 ATE设置回显功能 ATE0:回显关闭 ATE1:回显开启 ATCGMI 返回模块厂家信息 ATCGMM 返回模块型…

4G传输模块的功能应用

4G传输模块主要用在物联网中的数据传输方面&#xff0c;这种模块支持主动采集、多种协议、GPRS定位以及各种网络协议&#xff0c;并且接口丰富&#xff0c;还可以实时查看程序参数配置&#xff0c;接下来&#xff0c;安传物联的编辑就来为大家介绍一下这种常用的模块吧 一、主动…

同时挂载二维码模块与4G模块时,导致4G模块连不上网都是USB设备)

一、BUG现象 今天公司设备出现一个问题&#xff0c;在RK3399上的USB上插着三个设备&#xff0c;分别是4G模块、二维码模块与身份证模块&#xff0c;在这三个设备同时插在设备上时再开机&#xff0c;会出现4G模块连不上网络的情况&#xff0c;无论怎么插拔4G模块都无法联网。而…

工业4G路由器 小体积4G LTE通信模块转有线转WiFi充电桩视频安防监控物联网路由器上网CPE

4G LTE代表第四代长期演进&#xff0c;这是一种用于通过蜂窝网络提供高速数据传输的无线通信技术。它是移动网络技术的最新标准&#xff0c;提供比其前身3G更快的数据传输速度。它广泛用于移动设备、物联网设备和机器对机器通信。 近年来&#xff0c;随着物联网技术的快速发展…

如何在飞腾平台使用4G模块拨号上网

经常看到在笔记本上可以通过插无线网卡进行wifi连接上网&#xff0c;鲜有使用4G模块进行上网的。但是在某些场景下&#xff0c;没有wifi信号&#xff0c;要如何解决上网问题呢&#xff1f;一般可以通过usb共享手机网络&#xff0c;或者外接4G网卡进行上网。通常在windows 平台上…

windows10使用4G模块上网

1、硬件配置 1&#xff09;华为4G模块&#xff1a;HUAWEI ME909s-821 2&#xff09;PCIE转USB开发板 3&#xff09;联通4G手机SIM卡 4&#xff09;装有windows10的电脑 2、软件环境 下载安装华为4G模块驱动&#xff1a;http://www.ddooo.com/softdown/73296.htm 3、环境搭建…

实现4G模块EC20在linux系统下的拨号上网

前言&#xff1a; 为了方便查看博客&#xff0c;特意申请了一个公众号&#xff0c;附上二维码&#xff0c;有兴趣的朋友可以关注&#xff0c;和我一起讨论学习&#xff0c;一起享受技术&#xff0c;一起成长。 1.实验目的&#xff1a; 实现4G模块EC20在linux系统下的拨号上网…

4G无线模块 电力通信模块

4G无线模块TD210&#xff0c;标准通讯接口及协议&#xff0c;电力规约、环保212、MODBUS-RTU协议等&#xff0c;通过串口的形式采集各种电力参数&#xff0c;电压&#xff0c;电流&#xff0c;有功功率&#xff0c;无功功率&#xff0c;有功电度&#xff0c;无功电度&#xff0…

thinkpad x270 加装内置4G模块实现移动上网的记录

手上有一个thinkpad x270&#xff0c;固态硬盘&#xff0c;运行流畅&#xff0c;看到新出产的x1、x13标配4G上网&#xff0c;不免心中有点馋&#xff0c;因此计划对x270加装4g模块。 通过观看拆机视频&#xff0c;发现这货与x250等机型一样&#xff0c;有一个m.2 key B 的接口…