【回归分析】一文读懂岭回归,附案例教学

article/2025/9/13 3:54:59

1、作用

岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。

2、输入输出描述

输入:自变量X至少一项或以上的定量变量或二分类定类变量,因变量Y要求为定量变量(若为定类变量,请使用逻辑回归)。
输出:模型检验优度的结果,自变量对因变量的线性关系等等。

3、学习网站

SPSSPRO-免费专业的在线数据分析平台

4、案例示例

案例:通过自变量(房间面积、楼层高度、房子单价、是否有电梯、周围学校数量、距地铁站位置)拟合预测因变量(房价),现在发现房子单价与楼层高度之间有着很强的共线性,VIF值高于20;不能使用常见的最小二乘法OLS回归分析,需要使用岭回归模型。

5、案例数据

岭回归案例数据

6、案例操作

Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

step4:选择【岭回归(Ridge)】;
step5:查看对应的数据数据格式,【岭回归(Ridge)】要求自变量X至少一项或以上的定量变量或二分类定类变量,因变量Y要求为定量变量。
step6:点击【开始分析】,完成全部操作。

7、输出结果分析

输出结果1:岭迹图


图表说明: 通过岭迹图,确定K值。K值的选择原则是各个自变量的标准化回归系数趋于稳定时的最小K值。但通过岭迹图分析方法确定的岭参数 k 在一定程度上存在主观人为性,psspro采用方差扩大因子法自动确定K=0.162。

输出结果2:岭回归分析结果

*p<0.05,**p<0.01,***p<0.001
图表说明:岭回归的结果显示:基于字段面积、楼层、单价、周围学校数量(1km)、距地铁站距离(km)、配套电梯回归模型显著性 值为0.000***,水平上呈现显著性,拒绝原假设,表明自变量与因变量之间存在着回归关系。同时,模型的拟合优度 ²为0.956,模型表现为较为较为优秀,因此模型基本满足要求。

模型的公式:
总价=-64.72+0.987 × 面积-0.043 × 楼层+0.008 × 单价-0.447 × 周围学校数量(1km)-4.198 × 距地铁站距离(km)-3.674 × 配套电梯r/&amp;gt;<br/>输出结果3:模型路径图


图表说明:上图以路径图形式展示了本次模型结果,主要包括模型的系数,用于分析模型的公式。

输出结果4:模型结果图


图表说明:上图以可视化的形式展示了本次模型的原始数据图、模型拟合值。

8、注意事项

  • 一般在做岭回归之前,先采用线性回归(最小二乘法回归),如果发现自变量VIF(共线性)过大,如超过10,才使用岭回归;
  • SPSSPRO采用方差扩大因子法来自动寻找K值;
  • 选取 k值的一般原则是:
    • 各回归系数的岭估计基本稳定
    • 用最小二乘法估计的符号不合理的回归系数,其岭估计的符号变得合理
    • 回归系数没有不合乎经济意义的绝对值
    • 残差平方和增加不太多

9、模型理论

岭回归(Ridge Regression)是回归方法的一种,属于统计方法。在机器学习中也称作权重衰减。也有人称之为Tikhonov正则化。岭回归主要解决的问题是两种:一是当预测变量的数量超过观测变量的数量的时候(预测变量相当于特征,观测变量相当于标签),二是数据集之间具有多重共线性,即预测变量之间具有相关性。
一般的,回归分析的(矩阵)形式如下:

一般情况下,使用最小二乘法求解上述回归问题的目标是最小化如下的式子:

岭回归就是要在上述最小化目标中加上一个惩罚项:

这里的λ也是待求参数。也就是说,岭回归是带二范数惩罚的最小二乘回归。
 

10、参考文献

[1] 刘超,回归分析——方法、数据与R的应用,高等教育出版社,2019


http://chatgpt.dhexx.cn/article/0eIpaDod.shtml

相关文章

人工智能——岭回归(Python)

目录 1 概述 1.1 线性回归 1.2 岭回归 1.3 过拟合 2 sklearn中的岭回归 3 案例 3.1 数据介绍&#xff1a; 3.2 实验目的&#xff1a; 3.3 数据特征如下&#xff1a; 4 Python实现 4.1 代码 4.2 结果 5 正则化 1 概述 1.1 线性回归 对于一般地线性回归问题&am…

岭回归(Ridge Regression)和Lasso回归

1、岭回归&#xff08;Ridge Regression&#xff09; 标准线性回归&#xff08;简单线性回归&#xff09;中&#xff1a; 如果想用这个式子得到回归系数&#xff0c;就要保证(X^TX)是一个可逆矩阵。 下面的情景&#xff1a;如果特征的数据比样本点还要多&#xff0c;数据特征…

岭回归详解 从零开始 从理论到实践

岭回归详解 从零开始 从理论到实践 一、岭回归的理解1.1、LinearRegression的回顾1.2、岭回归 - Ridge Regression 二、sklearn的使用2.1、方法、参数与属性2.1.1、特征标准化 - StandardScaler2.1.2、岭回归 - Ridge2.1.3、内置交叉验证岭回归 - RidgeCV 2.2、实例应用2.2、简…

分布式之Quorum NWR算法

写在前面 假设现在我们实现了AP 系统&#xff0c;但是公司突然要对某些业务进行实时的数据计算&#xff0c;并且要求按照强一致性的方式来读取数据&#xff0c;此时作为系统设计这的我们该怎么办呢&#xff1f;单独为这部分业务实时抽出最新数据&#xff1f;还是修改原有系统&…

glusterfs:Server-quorum和Client Quorum

overview 这两个参数在容错场景中发挥着巨大的作用。用户借助这两个参数 既可以手动控制存在多少个活着的节点表示集群健康&#xff0c;也可以把这个控制权交给集群。 Server-quorum 由两个参数组成 cluster.server-quorum-type: none | server 如果设置为server表示启动了s…

Quorum机制

/******************************************************** 原文链接&#xff1a;http://www.cnblogs.com/jzhlin/archive/2012/07/23/2605077.html ********************************************************/ 分布式系统的设计中会涉及到许多的协议、机制用来解决可靠性问…

Elasticsearch:理解 Master,Elections,Quorum 及 脑裂

集群中的每个节点都可以分配多个角色&#xff1a;master、data、ingest、ml&#xff08;机器学习&#xff09;等。 我们在当前讨论中感兴趣的角色之一是 master 角色。 在 Elasticsearch 的配置中&#xff0c;我们可以配置一个节点为 master 节点。master 角色的分配表明该节点…

Quorum简介部署

文章目录 简介账户/密钥管理隐私私有交易管理器 (Private transaction Manager)enclave公有/私有状态 状态验证交易和合约隐私 (Transaction and Contract Privacy)参考 简介 GoQuorum基于geth&#xff0c;在其基础上增加了一些联盟链需要的组件&#xff0c;主要包括以下几点&…

分布式系统理论之Quorum机制

一&#xff0c;Quorum机制介绍 对于数据存储而言&#xff0c;为了提高可用性&#xff08;Availability&#xff09;&#xff0c;采用了副本备份&#xff0c;比如对于HDFS&#xff0c;默认每块数据存三份。某数据块所在的机器宕机了&#xff0c;就去该数据块副本所在的机器上读…

Hyperledger/Quorum等区块链技术综述

[1]邵奇峰,张召,朱燕超,周傲英.企业级区块链技术综述[J].软件学报,2019,30(09):2571-2592. 摘要&#xff1a;在传统跨机构交易的企业应用中,各个机构都是独立记录己方的交易数据,机构间数据的差异会引起争议,通常需要人工对账或中介机构来解决,因而增加了结算时间和交易费用.区…

基于以太坊项目quorum多机多节点搭建_1

准备工作 环境搭建 我这里使用4台虚拟机来模拟实际网络&#xff0c;在这四台虚拟机里分别搭建了quorum节点。 我这里使用quorum maker 工具来搭建quorum quorum maker 是一个带UI界面的自动化搭建quorum的工具。 quorum maker 安装 git clone https://github.com/synechr…

Quorum白皮书

Quorum白皮书下载

【quorum源码】quorum tessera源码剖析

目录 概述1. 项目结构2. 数据库结构3. 主要流程3.1 服务启动3.2 交易处理3.3 加密交易 4. Restful API4.1 Q2TRestApp4.2 ThirdPartyRestApp4.3 P2PRestApp4.4 EnclaveApplication 5. 一些核心接口App、Enclave相关的类图&#xff1a;com.quorum.tessera.server.TesseraServerc…

Quorum NWR算法

假如我们遇到这样一种事情&#xff1a;你开发实现了一套 AP 型的分布式系统&#xff0c;实现了最终一致性。业务也接入了&#xff0c;运行正常&#xff0c;一起看起来都那么美好。可是&#xff0c;突然有同事说&#xff0c;我们要拉这几个业务的数据做实时分析&#xff0c;希望…

paxosquorum

注&#xff1a; 这里谈论的2PC不同于事务中的2PC&#xff0c;而是专门为了同步和高可用改过的2PC协议 问题&#xff1a; 寻求一种能够保证&#xff0c;在给定多台计算机&#xff0c;并且他们之间由网络相互连通&#xff0c;中间的数据没有拜占庭将军问题(数据不会被伪造)的前…

分布式共识算法随笔 —— 从 Quorum 到 Paxos

分布式共识算法随笔 —— 从 Quorum 到 Paxos 概览: 为什么需要共识算法&#xff1f; 昨夜西风凋碧树&#xff0c;独上高楼&#xff0c;望尽天涯路 复制(Replication) 是一种通过将同一份数据在复制在多个服务器上来提高系统可用性和扩展写吞吐的策略, 。常见的复制策略有主从…

Quorum工作原理

文章目录 1. 概述2. 逻辑架构2.1 Quorum Node2.2 Constellation&#xff08;星座&#xff09;2.3 Tessera&#xff08;特赛拉&#xff09;2.4 Transaction Manager2.5 Enclave 3. 交易&#xff08;事务&#xff09;处理3.1 公开交易3.2 隐私交易3.3 交易处理3.4 隐私交易流程&a…

Quorum共识简析

背景 区块链共识是指多个节点或代理在给定的时间点就区块链状态达成一致的能力。当涉及区块链上分散记录保存和验证的核心功能时&#xff0c;单独依靠信任来确保添加到账本的信息是正确的可能会存在问题。因为没有中央实体来进行仲裁&#xff0c;这种问题在去中心化网络中更为…

Quorum区块链原理及其概念

Quorum概述 Quorum是由摩根大通研发的企业级区块链&#xff0c;用于解决金融或满足于企业需求的行业的需求的平台[56]。Quorum是基于以太坊扩展研发的一种联盟链&#xff0c;适用于对交易效率和吞吐量比较高的企业应用。Quorum作为以太坊的许可实施方案&#xff0c;对以太坊设…

Quorum 机制(分布式系统)

Quorum 机制&#xff0c;是一种分布式系统中常用的&#xff0c;用来保证数据冗余和最终一致性的投票算法&#xff0c;其主要数学思想来源于鸽巢原理。 基于Quorum投票的冗余控制算法 在有冗余数据的分布式存储系统当中&#xff0c;冗余数据对象会在不同的机器之间存放多份拷贝…