[DataAnalysis]多元线性回归深入浅出-案例+模型假设+参数估计方法+模型评判方法+变量选择+多重共线性问题

article/2025/8/27 21:36:12

一、案例介绍

1、目的:利用上市公司当年的公开财务指标预测来年盈利情况最重要的投资人决策依据。

2、数据来源:随机抽取深市和沪市2002和2003年的500个上市公司样本预测来年的净资产收益率。

3、解释变量包括:资产周转率、当年净资产收益率、债务资本比率、市盈率、应收账款/主营业务收入、主营业务利润、存货/资产总计(反映公司存货状况)、对数资产总计(反映公司规模)

二、描述性分析

1、各个标量的均值、最小值、中位数、最大数和标准差

2、变量相关性分析:相关性矩阵

3、当期净资产收益率和往期净资产收益率的散点图

三、建立模型:

1、多元线性回归模型:

2、模型假设:

(1)解释变量是非随机的,且各解释变量之间互不相关(多重共线性)

(2)随机误差项具有零均值、同方差和不序列相关性

(3)解释变量和随机项不相关

(4)随机项满足正态分布

总结即:随机项满足零均值、同方差、不序列相关的正态分布;解释变量和随机项不相关且解释变量之间互不相关

3、参数估计:

(1)最小二乘估计量:

RSS=\sum (y_{i}-\hat{\beta_{0}}-\hat{\beta_{1}}x_{i1}- \hat{\beta_{2}}x_{i2}-...-\hat{\beta_{p}}x_{ip})^2

(2)方差估计量:

\hat{\sigma }^2=RSS/(n-p-1)

(3)拟合优度:

总平方和:SST=\sum (y_i-\bar{y})^2

残差平方和:SSe=\sum (y_i-\bar{y})^2

R-square:R^2=1-\frac{SSE}{SST}

4、显著性检验:

(1)F检验

假设:H_0:\beta_i=0 vs H_1:\beta_i\neq 0

检验统计量:F=\frac{(SST-SSE)/p)}{SSE/(n-p-1))}\sim F_{p,n-p-1}

(2)t检验

假设:H_0:\beta_i=0 vs H_1:\beta_i\neq 0

检验统计量:T=\frac{\hat{\beta_i}}{\sqrt{\sigma ^2/n}}\sim t_{n-p-1}

5、模型检验

(1)异方差性

(2)正态性检验:

QQ图:残差的分位数和正态分布的分位数呈线性关系

Shapiro-Wilk normality test

Kolmogorov-Smirnov test

(3)异常值检验:待补充

Cook距离

(4)多重共线性检验:

见五介绍多重共线性

四、变量选择与预测:

只有三个变量显著性通过,但是无法排除其他变量是否有预测能力。从而我们通过AIC和BIC准则选择。原理:同时考虑到了模型复杂度和拟合效果。

AIC=n(log(\frac{RSS}{n})+1+log(2\pi ))+2p

BIC=n(log(\frac{RSS}{n})+1+log(2\pi))+logn*p

五、多重共线性问题:

1、变量相关性对模型造成的影响:

(1)完全多重共线性会使OLS(普通最小二乘)系数矩阵方程 解不唯一(基本上不存在完全多重共线性,多是不完全多重共线性),不完全多重共线性会使OLS估计量的方差和标准误较大(因为),即使得估计精度很小和置信区间变宽。

(2)多重共线性由于自变量之间的相关性,从而变量估计系数可能出现完全相反的符号或者难以置信的数值。

(3)可能出现显著自变量回归系数不显著:因为标准误较大,从而t检验的t值较小,倾向于接受原假设。

(4)R方值较高,但t值并不都是统计显著的。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。具体解释见补充资料1:回归拟合增加解释变量为什么增加拟合优度。方差膨胀因子越接近1,多重共线性越严重。这个时候R2越接近1。

2、多重共线性的诊断方法:

(1)R2较高但t值统计显著的不多。

(2)解释变量两两高度相关。

(3)方差膨胀因子

3、方差膨胀因子:

(1)考虑辅助回归:x_i=a+\sum_{j=1}^{n}b_jx_j+e

(2)R_{i}^{2}是辅助回归的拟合优度

(3)方差膨胀因子:VIF_i=\frac{1}{1-{R_{i}}^{2}}

在一定程度上在多大程度上第i个变量所包含的信息被其他变量覆盖。一般认为小于10就没有多重共线性问题。

 


http://chatgpt.dhexx.cn/article/6eNc3tFX.shtml

相关文章

基于spss的多元回归分析模型

还是数学建模中的一个小问题,具体概念分析在百度上的大佬说的已经足够详细,在此不再赘述。 链接: 多元回归分析. 我主要根据实例讲解如何通过spss进行建模,并进行模型参数的分析和验证。 打开spss(如果遇到打不开的情况&#x…

多元线性回归分析预测法概述

在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如&#xff0…

用R进行多元线性回归分析建模

概念:多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 下面我就举几个例子来说明一下 例一:谋…

基于Python的多元线性回归分析

一、多元线性回归分析(Multiple regression) 1.与简单线性回归相比较,具有多个自变量x 2.多元回归模型 其中是误差值,与简单线性回归分析中的要求特点相一致。其余的系数和截距为参数。 3.多元回归方程 4.估计多元回归方程(点估…

多元线性回归--案例分析及python实践

回归分析--多元回归 介绍一下多元回归分析中的统计量 总观测值总自变量自由度:回归自由度 ,残差自由度 SST总平方和 SSR回归平方和 SSE残差平方和 MSR均方回归 MSE均方残差 判定…

回归分析:多元线性回归模型 白话解析与案例实现

文章目录 线性学习多元线性回归模型多元线性回归模型的python实现 线性学习 回归分析是研究自变量x与因变量y的关系的方法。 上一节我们介绍了一元线性回归,经验公式为: $ \hat{y}\hat{\beta}1 x\hat{\beta}0 $ 在实际生活中,我们要研究的…

多元统计分析——多元线性回归

1. 经典的线性回归分析与交叉验证 examDict{ 学习时 :[0.50, 0.75, 1.00, 1.25,1.50,1.75, 1.75,2.00, 2.25,2.50, 2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50], 分:[10,22,13 ,43,20,22,33,50,62 , 48,55,75,62,73,81,76,64,82,90,93]} examDf pd.DataFrame(examDi…

spss进行多元线性回归并分析表格(转载)

1.如何使用spss进行多元线性回归。 2.分析生成结果,并判断回归是否可行。 一、使用spss进行多元线性回归: 1.输入数据 二、表格结果分析: R方是检验回归是否成功的重要要素之一,DW是残差独立性检验,衡量标准如下&…

数据分析方法--回归分析方法((SPSS建模:多元线性回归案例)

文章目录 回归定义最常用回归方法一、线性回归(Linear Regression)二、逻辑回归(Logistic Regression)三、多项式回归(Polynomial Regression)四、逐步回归(Stepwise Regression)五、岭回归(Ridge Regression)六、套索回归(Lasso Regression)七、回归(ElasticNet) 如何正确选择…

线性回归 - 多元线性回归案例 - 分析步骤、输出结果详解、与Python的结果对比 -(SPSS建模)

现在用 Python 写线性回归的博客都快烂大街了,为什么还要用 SPSS 做线性回归呢?这就来说说 SPSS 存在的原因吧。 SPSS 是一个很强大的软件,不用编程,不用调参,点巴两下就出结果了,而且出来的大多是你想要的…

SPSS--回归-多元线性回归模型案例解析!(一)

SPSS--回归-多元线性回归模型案例解析!(一) 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如&#x…

多元回归分析(线性回归)

多元线性回归分析 一、回归的基本理解(1)回归的基本任务(2)回归里的关键词(3)回归里的数据类型(4)回归方程中的系数解释(5)扰动项要满足的条件(1&…

多元线性回归分析详细介绍

一文搞懂——多元线性回归分析 回归分析定义回归的使命回归分析的分类数据的分类数据的收集 线性回归对于线性的理解回归系数的解释核心解释变量和控制变量四类模型回归系数的解释特殊的自变量:虚拟变量X含有交互项的自变量 回归实例题目Stata解决第一步&#xff1a…

多元线性回归分析示例

GLM模型应用于脑功能影像分析时,在某个因素影响下,由beta图,经过t检验得到脑区显著激活的区域。应用于其他地方也可加深我们对于模型的理解。 clc,clear; X[ 136.5 215136.5 250136.5 180138.5 2501…

【课程设计】计算机组成与系统结构

计算机组成与系统结构课程设计(2020.12) 保姆式教程 目录 计算机组成与系统结构课程设计(2020.12)一、本课程设计的性质、目的、任务二、本课程设计的基本理论三、课程设计的主要内容四、微程序流程图(树形图)五、模型机微指令表六、机器指令程序的说明…

计算机组成与系统结构课程设计

课程设计题目 综合运用所学计算机原理知识,设计并实现具有以下16条指令的指令集结构的模型计算机: 编号 助记符 机器指令码 说明 0 SUB Rd,Rs 0000 RdRs Rd-Rs→Rd 1 ADD Rd,Rs 0001 RdRs RdRs→Rd 2 AND Rd,Rs 0010 RdRs Rd&Rs→Rd (Rd和…

计算机毕业设计、计算机课程设计怎么做?计算机设计1900套来帮你!

计算机毕业设计、计算机课程设计怎么做?计算机设计1900套来帮你! 人生做什么事都有套路,大学毕业设计、课程设计通常比较简单,大多数都是找个项目做参考,有的人随便抄一抄糊弄一下,只要查重,格…

pycharm 安装numpy包——超简单

非常简单的安装步骤,自己百试不爽哦,废话不多说直接上图按以下步骤进行即可 一、找到安装numpy的地方 file→settings→project interpreter,点击右侧的+号 二、进行numpy 安装 搜索框内手动输入numpy进行搜索,选中…

python 如何安装numpy库?

(我的微信:Kingsplusa,我总结了人工智能手推笔记和思维导图,欢迎一起进步学习。) 首先我们要找到python安装的位置 winR打开 进入以后输入: where python 找到安装目录后,找到Scripts文件…

python中Numpy包的安装及使用

*****安装 python (本文安装 python2.7) *****安装 pip (1)检查是否已安装pip 进入cmd命令窗口,输入 pip --version ,查看是否已安装pip,说明已安装了pip 否则,说明未安装pip 需要进入(2&am…