回归分析案例分析全流程

article/2025/8/18 0:01:33

一、案例说明

1.案例数据

在“工资影响因素”的调查问卷中,调查了每个人的起始工资、工作经验、受教育年限、受雇月数、职位等级以及当前工资六个方面。

2.分析目的

目的是建立以当前工资为因变量的回归模型,并得出结论。[案例来源于:SPSS统计分析(第5版)卢纹岱,朱红兵主编,案例有一些变动 具体请看分析。]

二、数据清理

在数据分析之前,首先需要进行数据查看,包括数据中是否有异常值,无效样本等。如果有异常值则需要进行处理,然后再进行分析。另外如果数据中有无效样本也需要进行处理后再进行分析。无效样本会干扰分析研究,扭曲数据结论等,因而在分析前先对无效样本进行标识显示尤其必要。异常值的鉴别与处理一般分为三个部分,其中分别是判断标准,鉴别方法以及异常值的处理,以下从这三个方面进行说明。

异常值的判断标准如下:

检验数据是否有异常值的方法:

异常值处理方法:

此案例对于异常值参照的标准为大于±3个标准差

使用描述分析进行查看发现没有异常值。

除了对异常值处理外,还需要对于无效样本的检查:如果数据来源为问卷,则很可能出现无效样本,因为填写问卷的样本是否真实填写无从判定;如果数据库下载或者使用二手数据等,也可能出现大量缺失数据等无效样本。以下从无效样本场景、SPSSAU设置标准、处理三方面进行说明。

1.常见场景

2.设置标准

3.无效样本的处理

设置好无效样本后,默认会新生成一个标题,用来标识那些样本是有效,那些是无效,在分析的时候直接进行筛选下就好。

本次案例分析将以相同数字大于70%为标准进行检验,结果显示没有无效样本。

三、基本关系查看

1.散点图

做数据的散点图,观察因变量与自变量之间是否具有线性特点。

从上图中可以看出,当前工资和起始工资、受教育年限、职位等级以及工作经验均存在线性关系,其中Y轴为因变量当前工资,X轴为自变量,但是从图中观察到对于“起始工资和当前工资”及“工作经验和当前工资”可能存在异常值,进行数据复查后发现,数据均在可接受范围内,所以不进行处理。

2.相关性分析

相关分析是研究有没有关系,回归分析是研究影响关系。明显地,相关分析是基础,然后再进行回归分析。首先需要知道有没有相关关系;有了相关关系,才可能有回归影响关系;如果没有相关关系,是不应该有回归影响关系的。

分析结果来源于SPSSAU

从上表可知,利用相关分析去研究当前工资和受教育年限, 职位等级, 起始工资, 工作经验共4项之间的相关关系,使用Pearson相关系数去表示相关关系的强弱情况。具体分析可知:
当前工资与受教育年限, 职位等级, 起始工资, 工作经验共4项之间的相关关系系数值呈现出显著性。具体分析请看SPSSAU智能分析:

四、模型效果

1.F检验

从上表可以看出,离差平方和为1461615.460,残差平方和为579191.966,而回归平方和为882423.494。回归方程的显著性检验中,统计量F=178.635,对应的p值远远小于0.05,被解释变量的线性关系是显著的,可以建立模型。建立模型后,需要查看模型拟合优度是否可以,其中就可以查看R方与调整R方值。

2.R方和调整R方

分析结果来源于SPSSAU

从上表可知,将起始工资,受教育年限,职位等级,工作经验作为自变量,而将当前工资作为因变量进行线性回归分析,从上表可以看出,模型R方值为0.604,调整R方为0.600,其中R方是决定系数,模型拟合指标。反应Y的波动有多少比例能被X的波动描述。调整R方也是模型拟合指标。当x个数较多是调整R²比R²更为准确。意味着起始工资,受教育年限,职位等级,工作经验可以解释当前工资的60.4%变化原因。可见,模型拟合优度较好,说明被解释变量可以被模型解释的部分较多。接下来查看变量是否具有多重共线性。

3.VIF值

分析结果来源于SPSSAU

VIF值用于检测共线性问题,一般VIF值小于10即说明没有共线性(严格的标准是5),有时候会以容差值作为标准,容差值=1/VIF,所以容差值大于0.1则说明没有共线性(严格是大于0.2),VIF和容差值有逻辑对应关系,因此二选一即可,一般描述VIF值。在【线性回归】分析时,SPSSAU会智能判断共线性问题并且提供解决建议。 结果中可以看出,变量的VIF值均小于5,所以此案例不存在多重共线性的问题。

但是如果存在多重共线问题,建议三种解决方法一是使用逐步回归分析(让模型自动剔除掉共线性过高项);二是使用岭回归分析(使用数学方法解决共线性问题),三是进行相关分析,手工移出相关性非常高的分析项(通过主观分析解决),然后再做线性回归分析。

多重共线性问题,如何解决?

结果中的DW值有什么用呢?下面进行说明。

4.DW值

D-W值也称Durbin-Watson值一般对于时间序列分析才会考虑DW值:

  1. 当残差与自变量互为独立时,DW≈2;
  2. 当相邻两点的残差为正相关时,DW<2;
  3. 当相邻两点的残差为负相关时,DW>2;

5.AIC和BIC

分析结果来源于SPSSAU

最后针对模型中的AIC值与BIC值说明如下:

AlC值是衡量统计模型拟合优良性的一种标准,AIC越小,模型越好。BIC值一可有效防止模型精度过高造成的模型复杂度过高。接下来对模型结果进行一一分析。

五、模型结果

1.模型公式

分析结果来源于SPSSAU

从上表可知,将起始工资,受教育年限,工作经验,职位等级作为自变量,而将当前工资作为因变量进行线性回归分析,从上表可以看出,模型公式为:当前工资=-41.634 + 0.425*起始工资 + 6.176*受教育年限-0.051*工作经验 + 29.819*职位等级。

2.回归系数

上图所示,回归方程的常数项约为-41.63,以及起始工资、受教育年限、工作经验以及职位等级的非标准化系数分别为0.425、6.176、-0.051、29.819。表中4个变量的p值均小于0.05,并且VIF值均正常,因此4个变量可以显示在模型中。

3.coefPlot

coefPlot展示具体的回归系数值和对应的置信区间,可直观查看数据的显著性情况,如果说置信区间包括数字0则说明该项不显著,如果置信区间不包括数字0则说明该项呈现出显著性。所以上图中四个分析项的置信区间都不包括0,都呈现显著性。

4.标准化系数

起始工资、受教育年限、工作经验以及职位等级的标准化系数分别为0.163、0.320、-0.096、0.415. 标准化系数一般可用于比较自变量对Y的影响程度。系数值越大说明该变量对Y的影响越大。可以看出模型中职位等级对当前工资影响较大。

5.模型预测

总结来看,模型公式为:当前工资=-41.634 + 0.425*起始工资 + 6.176*受教育年限-0.051*工作经验 + 29.819*职位等级(案例数据分析结果仅供参考)。

6.残差图

上图为残差正态分布图(P-P图),由上图可以看出残差的分布符合大致正态分步。说明回归结果就数据而言是较为可靠的。

六、模型综述

通过数据清理发现数据适合做回归分析,然后对模型进行分析与总结。,比如多重共线性等,经过分析,得到起始工资、工作经验、受教育年限、受雇月数、职位等级4个自变量以及当前工资因变量之间的关系,对预测模型进行分析。回归分析不只是线性回归,还包括曲线回归、非线性回归等,这些知识的学习还需要大家进行查看相关资料自行摸索。


http://chatgpt.dhexx.cn/article/3KbArvdw.shtml

相关文章

1.1 一元线性回归分析案例

#将pyplot字体转化成中文 matplotlib.rcParams[font.family] Microsoft YaHei plt.rcParams[font.size] 12 # 设置字体大小 plt.rcParams[axes.unicode_minus] False # 设置正常显示负号案例背景&#xff1a;寻找房屋面积与价格的关系并进行预测图 #需要的包 import matp…

Spring WebFlux (6): RSocket 服务实现

RSocket官网&#xff1a;https://rsocket.io/ RSocket是一种二进制协议&#xff0c;可用于字节流传输&#xff0c;例如TCP&#xff0c;WebSockets和Aeron。 提供了四中交互模式&#xff1a; request/response (stream of 1) 请求/响应&#xff08;单响应&#xff09;大多数请…

HTTP协议的挑战者:RSocket

点击蓝色“程序猿DD”关注我 回复“资源”获取独家整理的学习资料&#xff01; 1. 简介 RSocket是一种二进制的点对点通信协议&#xff0c;是一种新的网络通信第七层协议。旨在用于分布式应用程序中。从这个意义上讲&#xff0c;RSocket是HTTP等其他协议的替代方案。它是一种基…

使用 RSocket——服务端主动调用客户端方法

1. 编写客户端接收请求的逻辑 我们可以在初始化 Rsocket 实例的时候指定客户端可以被调用的方法&#xff0c;使用 acceptor() 指定可被调用的方法和方法使用的通信模型类型&#xff1a; 通信类型为 RequestResponse 时&#xff1a; .acceptor(SocketAcceptor.forRequestRespo…

RSocket 与 gRPC性能对比

几乎每次我向观众介绍RSocket时&#xff0c;都会有人问这个问题&#xff1a;“ RSocket与gRPC相比如何&#xff1f;” 今天我们要找出答案。 搭建平台 插座 RSocket在应用程序网络上实现反应式语义。它是一种网络协议&#xff0c;可端对端实施反压力和其他反应流概念。 gR…

浅谈RSocket与响应式编程

简介&#xff1a; RSocket是高效一个二进制的网络通讯协议&#xff0c;能够满足很多场景下使用。另外&#xff0c;RSocket也是一个激进的响应式捍卫者&#xff0c;激进到连API都跟响应式无缝集成。本文我们将和大家分享RSocket与响应式编程。 作者 | 素渡 来源 | 阿里技术公众号…

阿里雷卷:RSocket从入门到落地,RSocket让AJP换发青春

考虑很久&#xff0c;决定还是写一下这篇文章&#xff0c;主要是 AJP 技术太老&#xff0c;我只能说 Long long ago &#xff0c;估计我在用这个技术的时候&#xff0c;很多同学小学还没有毕业。但是没有问题&#xff0c;这篇文章只是一个架构启发&#xff0c;不会浪费你时间让…

云原生实践之 RSocket 从入门到落地:Servlet vs RSocket

技术实践的作用在于&#xff1a;除了用于构建业务&#xff0c;也是为了验证某项技术或框架是否值得大规模推广。 本期开始&#xff0c;我们推出《RSocket 从入门到落地》系列文章&#xff0c;通过实例和对比来介绍RSocket。主要围绕RSocket如何实现Polyglot RPC、Service Regi…

RSocket 基于消息传递的反应式应用层网络协议

下面基于RSocket的一些主要特性分别做一下介绍&#xff0c;并和HTTP之类的常见协议进行比较&#xff1a; Multiplexed, Binary Protocol 多路复用的二进制协议Bidirectional Streaming 双向流Flow Control 流控制Socket Resumption 连接恢复Message passing 消息传递模型Trans…

RSocket 从入门到落地:两种微服务对比

✏️ Pic by Alibaba Tech on Facebook 技术实践的作用在于&#xff1a;除了用于构建业务&#xff0c;也是为了验证某项技术或框架是否值得大规模推广。 这是《RSocket 从入门到落地》系列文章的第三篇&#xff0c;来一起对比下开发微服务应用和微服务之间的网络通讯。该系列文…

开源的技术底座技术中台spring cloud Rsocket 微服务

一、项目背景 企业对新技术、用户体验、需求响应、交互协作提出了新的要求 1、应用新技术&#xff1a; 物联网、人工智能、大数据挖掘和分析、机器人、自动化等 2、重用核心能力&#xff1a; 使组织能够在其ERP核心解决方案的基础上进行构建&#xff0c;并为“下一步做什么”铺…

spring响应式编程13 RSocket:一种新的高性能网络通信协议

前面几讲我们讨论了如何使用 WebFlux 构建响应式 Web 服务的实现方案。WebFlux 和 WebMVC 一样&#xff0c;都是基于 HTTP 协议实现请求-响应式的交互方式。这种交互方案很简单&#xff0c;但不够灵活&#xff0c;也无法应对所有的响应式应用场景。那么&#xff0c;有没有在网络…

RSocket 学习(二):HTTP VS WebSocket VS RSocket

在比对 HTTP、WebSocket、RSocket 之前&#xff0c;我们先通过下面这张 OSI 七层模型的图快速梳理一下网络通信的面貌&#xff0c; 以便后续更好地理解它们。 osi model.png 一. HTTP 的特性 超文本传输协议&#xff08;英语&#xff1a;HyperText Transfer Protocol&#xff0…

基于RSocket协议实现客户端与服务端通信

RSocket基础开发demo package com.pshdhx.rsocket;import io.rsocket.Payload; import io.rsocket.RSocket; import io.rsocket.util.DefaultPayload; import lombok.extern.slf4j.Slf4j; import org.reactivestreams.Publisher; import reactor.core.publisher.Flux; import …

响应式编程之网络新约:RSocket

响应式reactive是Java中高效应用的下一个前沿&#xff0c;但它目前主要有两个障碍&#xff1a;数据访问和网络。RSocket是一种新的第7层语言无关的应用网络协议&#xff08;解决后者&#xff09;&#xff0c;它由Facebook&#xff0c;Netifi和Pivotal等工程师开发&#xff0c;提…

一篇文章了解RSocket协议

RSocket是一个类似于HTTP的通讯协议。在了解Rsocket协议之前&#xff0c;先简单介绍下HTTP协议。 之所以推出springboot的技术&#xff0c;一个原因是因为前后端设计的分离。因为基于HTTP协议可以直接返回REST数据内容。 REST是一个简单且容易使用的异构处理架构&#xff0c;R…

RSocket 学习(一):初探

girl.jpg 一. RSocket 介绍 RSocket 是一种二进制字节流传输协议&#xff0c;位于 OSI 七层模型中的5、6层&#xff0c;对应 TCP/IP 模型中的应用层。RSocket 并没有规定必须使用何种底层传输层协议&#xff0c;开发者可以使用不同的底层传输协议&#xff0c;包括 TCP、WebSock…

RSocket——Http协议的替代者

1. 简介 RSocket是一种二进制的点对点通信协议&#xff0c;是一种新的网络通信第七层协议。旨在用于分布式应用程序中。从这个意义上讲&#xff0c;RSocket是HTTP等其他协议的替代方案。它是一种基于Reactive Streams规范具有异步&#xff0c;背压的双向&#xff0c;多路复用&…

java-语言学习-eclipse安装java汉化包

java的汉化&#xff1a; 1.打开链接&#xff1a;https://www.eclipse.org/babel/ 2.进入网页后&#xff0c;往下翻一点&#xff0c;看到一个download&#xff08;下图红框所示&#xff09;&#xff0c;点开。 3.进入一个页面后&#xff0c;往下翻一点点&#xff0c;看到有几…

安装Eclipse的中文语言包

安装Eclipse的中文语言包 下载语言包 1、进入网址 http://www.eclipse.org/babel 2、对应版本下载中文语言包 3、替换Eclipse软件安装文件的features、plugins&#xff0c;再次启动加载 4、替换出现The Eclipse executable launcher was unable to locate its companion l…