多重共线性如何分析?

article/2025/9/19 23:59:54

判断标准

常见的直观判断方法共有四个,如下:
(1)某些自变量的相关系数值较大(比如大于0.8)等,可以利用pearson相关系数检验法一般是利用解释变量之间的线性相关程度判断,一般标准是系数大于0.8则认为可能存在多重共线性。
(2)如果增加一个变量或者删除一个变量,回归系数的观测值变化很大。
(3)如果说F检验通过,并且决定系数值也较大,但是t检验并不显著,也可能存在多重共线性。
(4)回归系数的正负符号与专业知识相反或与实际分析结果不符,也会存在多重共线性的可能。
以上方法可能会存在误差,更多偏向于主观,还有一种正规检验方法,观察回归分析中的VIF值(方差膨胀因子),这个检验方法更为严谨、准确。通常的判断标准是VIF值大于10即具有多重共线性,有的文献也说大于5即有共线性。
其中VIF值如下:
VIF=(1
R2)1
从公式中我们发现VIF和R方是有直接关系的。
当VIF>5, 1-
 R2 <0.2, R2 >0.8;
当VIF>10, 1- R2 <0.1, R2 >0.9;
从上式可以看出,VIF若大于10其R方相对应也大于0.9,若VIF大于5其R方相对于大于0.8,如果存在这种现象,可以认为该自变量是其他自变量的近似线性组合,也就是说,在自变量之间存在高度相关的现象。

处理多重共线性

处理多重共线性经验式做法:

(1)删除不重要的共线性变量

但是删除变量后可能会导致模型和原本分析的模型不一样,可能会出现决策错误等现象。

(2)增加样本容量

多重共线性有可能与样本量过少有关,所以如果存在也可以加大样本量。但是加大样本量具有局限性比如实验已经结束或者其它原因。

(3)变量转换

构造一个新的变量,这一新变量是多重共线性变量的函数,然后用这个新的变量代替多重共线性的变量,但是要注意组合后的数据需要有实际意义否则模型不好解释。

其它处理方法:

  1. 岭回归
    岭回归分析是一种修正的最小二乘估计法,当自变量系统中存在多重共线性时,它可以提供一个有偏估计量,这个估计量虽有微小偏差,但它的精度却能大大高于无偏估计。
    如果使用SPSSAU进行分析岭回归一般有两个步骤:岭回归通过引入k个单位阵,使得回归系数可估计;单位阵引入会导致信息丢失,但同时可换来回归模型的合理估计。针对岭回归:其研究步骤共为2步,分别是结合岭迹图寻找最佳K值;输入K值进行回归建模
  2. 逐步回归
    逐步回归分析方法视自变量对因变量的影响显著性大小从大到小逐个引入回归方程,从处理角度来看逐步回归比岭回归和主成分回归要好一些。逐步回归面临着检验的显著性水平的选择困难它通常得不到最优变量子集,可以利用SPSSAU进阶方法中逐步回归进行分析。

3.主成分回归
主成分回归根据主成分分析的思想提出的。主成分估计和岭回归类似都是一种有偏估计。主成分分析利用降维的思想对数据信息进行浓缩,将多个分析项浓缩成几个关键概括性指标;剔除对系统影响微弱的部分。通过对各个主成分的重点分析,来达到对原始变量进行分析的目的。主成分回归就是用对原变量进行主成分分析后得到的新的指标来代替原变量,再使用最小二乘法进行回归分析。由于对原变量的综合,就可以起到克服多重共线性所造成的信息重叠的作用,从而消除多重共线性对回归建模的影响。

4.偏最小二乘法

偏最小二乘法不仅可以用单变量回归分析方法,也可以用于多变量回归分析方法,一般情况下处理样本量相对较小,自变量多的数据。


http://chatgpt.dhexx.cn/article/vDpZCZfM.shtml

相关文章

多元回归自变量存在共线性

多重线性回归要求各个自变量之间相互独立&#xff0c;不存在多重共线性。所谓多重共线性&#xff0c;是指自变量之间存在某种相关或者高度相关的关系&#xff0c;其中某个自变量可以被其他自变量组成的线性组合来解释。 医学研究中常见的生理资料&#xff0c;如收缩压和舒张压…

多重共线性

1.回归模型自变量彼此相关称为多重共线性&#xff0c;它给模型提供重复信息 2.多重共线性会造成模型不稳定&#xff0c;可能会得到无法解释的现象 3.检测共线性的方法通常有相关性分析&#xff0c;显著性检验和方差膨胀因子分析 4.处理共线性的方法通常有提前筛选变量&#xff…

多重共线性的影响、判定及消除的方法

目录 1 什么是多重共线性&#xff1f; 2 多重共线性的影响 3 共线性的判别指标&#xff08;方差膨胀因子&#xff09; 3.1 拟合优度 3.2 方差膨胀因子VIF 4 多重共线性处理方法 4.1 手动移除出共线性的变量 4.2 逐步回归法 4.2.1 向前法 4.2.2 后退法 4.2.3 逐步选…

如何处理多重共线性问题

一、说明 当回归模型中两个或者两个以上的自变量高度相关&#xff08;比如相关系数大于0.7&#xff09;时&#xff0c;则称为多重共线性。虽然在实际分析中&#xff0c;自变量高度相关是很常见的&#xff0c;但是在回归分析中存在多重共线性可能会导致一些问题&#xff0c;比如…

谈多重共线性

谈多重共线性 本文主要讨论古典假定中无多重共线性被违反的情况&#xff0c;主要情况包括多重共线性的实质和产生的原因、后果、检验方法及无多重共线性假定违反后的处置方法。 第一节 什么是多重共线性 一、多重共线性的含义 讨论多元线性回归模型的估计时&#xff0c;强调…

多重共线性详解

目录 解释变量与自变量&#xff0c;被解释变量与因变量 1、多重共线性的现象 2、出现的原因 3、判别标准 4、检验方法 5、多重共线性有什么影响 6、多重共线性处理方法 7、其他说明 8、多重共线性识别-python代码8.1、vif检验8.2 相关系数8.3 聚类 9、宏观把握共线性问题9.1、共…

浅谈共线性的产生以及解决方法(中篇——今生)

浅谈共线性的产生以及解决方法(中篇——今生) 上篇我们讲到共线性概念以及共线性问题存在时对模型的影响。那么如何对样本数据中存在的共线性问题进行诊断呢&#xff1f; 3 多重共线性的诊断方法 3.1 相关系数法 对于一个样本数据集&#xff0c;我们要了解解释变量&#xf…

共线性那些事儿

我们经常听说&#xff0c;建模时应当尽量避免共线性&#xff08;collinearity&#xff09;&#xff0c;共线性会导致参数估计不稳定、模型不可靠等等。那么共线性究竟有多可怕&#xff1f;共线性具体会带来什么问题&#xff1f;共线性得到的模型是否真的不行&#xff1f;笔者通…

多元线性模型中共线性产生的原因解析

在很多书籍中谈到了共线性问题&#xff0c;作为多元统计中基本假设之一&#xff0c;却经常被违背&#xff0c;影响模型稳定性和统计power。在不少的论文中谈到了&#xff0c;国内的很多书籍往往一笔带过。因为&#xff0c;属于统计计算领域内容&#xff0c;非专业人士&#xff…

好好谈谈共线性问题

好好谈谈共线性问题 马东什么 算法工程师 8 人 赞同了该文章 共线性&#xff0c;即 同线性或同线型。统计学中&#xff0c;共线性即 多重共线性。 多重共线性&#xff08;Multicollinearity&#xff09;是指线性回归模型中的解释变量之间由于存在精确 相关关系或高度相关关系而…

树莓派中SIM7600G-H 4G DONGLE模块使用记录(一)PPP拨号上网/4G上网

项目场景&#xff1a; 如何使用SIM7600系列的4G通信模块进行PPP网上拨号以实现4G通信&#xff0c;在讲解前&#xff0c;未搭建好树莓派远程连接桌面的读者可以先转向树莓派4B环境搭建电脑远程连接打开文件管理闪退(上)。 模块简介&#xff1a; SIM7600X 4G DONGLE是一款工业级…

Linux系统下使用4G模块EC20实现拨号上网

驱动的实现过程 实现4G功能分为两步,第一步内核能成功识别出该设备,第二步实现拨号上网.最后提一下自带的定位功能 一.添加内核USB驱动 这里直接使用内核已经存在的USB驱动,只需要让内核能识别出该USB设备,并自动加载驱动生成对应的/devUSB*设备节点 获取EC20的PID和VID 把模块…

4G模块适配与调试

笔记目录 RK平台4G模块适配1、识别VID、PID2、添加VID\PID到android的option驱动中3、插上sim卡&#xff0c;4G模块一定要接上天线4、根据安卓系统和安卓版本发给模块厂要求其提供ril库5、预置ril库6、在framework中添加根据pid和vid关联ril库的代码7、可以通过一下命令查看ril…

Linux 4G模块pppd拨号上网脚本解析

在编写脚本之前&#xff0c;要先安装好ppp相关驱动&#xff0c;pppd 已知pppd位于 /usr/sbin , chat 位于 /usr/sbin , options 位于 /etc/ppp 。 要编写脚本&#xff0c;就要切换目录到 /etc/ppp/peers&#xff0c;若没有peers目录则自行创建。因为是在/etc目录之下&#xf…

4G模块的使用

一、&#xff14;G相关知识 4G是第四代通讯技术。能够传输高质量视频图像。4G的下载速度达100Mbps&#xff0c;比目前的拨号上网快2000倍&#xff0c;上传的速度也能达到20Mbps&#xff0c;并能够满足几乎所有用户对于无线服务的要求。此外&#xff0c;4G可以在DSL和有线电视调…

4G模块使用总结

4G模块使用总结 一、APN名称 2G: 移动的CMWAP 联通的UNIWAP 移动的CMNET 联通的UNINET 3G/4G: 移动CMNET 联通3GNET 电信CTNET 二、模块信息参数获取 AT/r //检测串口通信状态 ATE设置回显功能 ATE0:回显关闭 ATE1:回显开启 ATCGMI 返回模块厂家信息 ATCGMM 返回模块型…

4G传输模块的功能应用

4G传输模块主要用在物联网中的数据传输方面&#xff0c;这种模块支持主动采集、多种协议、GPRS定位以及各种网络协议&#xff0c;并且接口丰富&#xff0c;还可以实时查看程序参数配置&#xff0c;接下来&#xff0c;安传物联的编辑就来为大家介绍一下这种常用的模块吧 一、主动…

同时挂载二维码模块与4G模块时,导致4G模块连不上网都是USB设备)

一、BUG现象 今天公司设备出现一个问题&#xff0c;在RK3399上的USB上插着三个设备&#xff0c;分别是4G模块、二维码模块与身份证模块&#xff0c;在这三个设备同时插在设备上时再开机&#xff0c;会出现4G模块连不上网络的情况&#xff0c;无论怎么插拔4G模块都无法联网。而…

工业4G路由器 小体积4G LTE通信模块转有线转WiFi充电桩视频安防监控物联网路由器上网CPE

4G LTE代表第四代长期演进&#xff0c;这是一种用于通过蜂窝网络提供高速数据传输的无线通信技术。它是移动网络技术的最新标准&#xff0c;提供比其前身3G更快的数据传输速度。它广泛用于移动设备、物联网设备和机器对机器通信。 近年来&#xff0c;随着物联网技术的快速发展…

如何在飞腾平台使用4G模块拨号上网

经常看到在笔记本上可以通过插无线网卡进行wifi连接上网&#xff0c;鲜有使用4G模块进行上网的。但是在某些场景下&#xff0c;没有wifi信号&#xff0c;要如何解决上网问题呢&#xff1f;一般可以通过usb共享手机网络&#xff0c;或者外接4G网卡进行上网。通常在windows 平台上…