第10章 最小二乘线性回归分析

article/2025/10/7 14:28:04

       

目录

10.1简单线性回归分析

1.描述性统计分析

2.对数据进行相关性分析

3.对数据进行回归分析的结果

4.变量的方差-协方差矩阵

5.对变量系数的假设检验结果 

 6.对因变量的拟合值的预测

7.回归分析得到残差序列

案例延伸

1.在回归方程中不包含常数项

2.限定参与回归的样本范围

3.关于回归预测

10.2多重线性回归分析

案例延伸

1.自动剔除不显著的变量


回归分析是经典的数据分析方法之一,应用广泛。它是研究分析某一变量受到其他变量影响的分析方法,基本思想是以被影响变量为因变量,以影响变量为自变量,研究因变量与自变量之间的因果关系。本章主要介绍最简单最常用的最小二乘线性回归分析方法(包括简单线性回归、多重线性回归)的应用。

10.1简单线性回归分析

        简单线性回归又称一元线性回归分析,是最简单也是最基本的一种回归分析方法。简单线性回归的特色是只涉及一个自变量,主要用来处理一个因变量一个自变量之间的线性关系,建立变量之间的线性模型并根据模型进行评价和预测。

        数据(案例10.1)菲利普斯曲线表明,失业率和通货膨胀之间存在着替代关系。案例10.1给出了我国1998年-2007年的通货膨胀率和城镇登记失业率。使用简单回归分析方法研究这种替代关系在我国是否存在。

1.描述性统计分析

        进行描述性统计是要看数据是否存在异常值(非常大、非常小),也有些时候各个变量之间的额量纲差距过大,例如某个变量是几百万,同时另一个变量是零点几,那么系统可能会把小变量忽略掉,这些都会严重影响数据的回归分析结果。

summarize year inflation unwork,detail #旨在对年份、通货膨胀率、失业率进行详细描述性分析

         通过上图我们可以的到很多信息,包括百分位数、4个最小值、4个最大值、平均值、标准差、偏度、峰度等。此部分解释在第三章中有着详细解说。由于我太懒所以我就不想多说了。

2.对数据进行相关性分析

        相关性分析是回归分析中非常重要的一部分,因为回归分析的本意就是研究自变量对因变量的影响关系,如果参与回归分析的变量本身就是不相关的,那么回归分析就会失去意义。如果通过回归分析探索出变量之间存在着一定关系,那么这种关系也未必是真是的。他可能仅仅是由于数据特征的某种巧合而拟合出了回归模型。综上所述,变量之间存在存在相关关系是进行回归分析的必要前提。

correlate year inflation unwork  #本指令是对三个变量进行相关性分析

3.对数据进行回归分析的结果

        从上面的结果中我们可以看到,共有10个样本参与了分析,模型F值(1,8)=5.36,P值(Prob > F)=0.0493,说明模型整体是非常显著的。模型的可决系数(R-squared)为0.4011,模型修正的可决系数(Adj R-squared)=0.3263,说明模型的解释能力还是差强人意的。

        模型的回归方程是:

        unwork=0.157083*inflation+3.0600665

        变量inflation的系数标准误是0.0678616,t值是2.31,P值为0.049,系数是非常显著的,95%的置信区间为[0.0005938,0.3135721]。常数项的系数标准误是0.148548,t值为24.21,P值为0.000,系数也是非常显著的,95%的置信区间是[3.257635,3.943694]。

        从上面的分析可以看出通货膨胀率和失业率之间是一种正向联动变化关系,通货膨胀率每增加一点,失业率就增加0.157点。通货膨胀和失业率的替代关系在我国并不存在。

4.变量的方差-协方差矩阵

vce #本命令是获得参与回归的各自变量的系数以及常数项的方差-协方差矩阵

        我们可以看出,变量的方差与协方差都不是很大。

5.对变量系数的假设检验结果 

test inflation  #本命令的含义是检验变量通货膨胀率的系数是否显著

        我们可以看出通货膨胀率的系数是非常显著的,在5%的显著性水平上通过了检验。

 6.对因变量的拟合值的预测

predict yhat #旨在对因变量的拟合值进行预测

        因变量预测拟合值是根据自变量的值和得到的回归方程计算出来的,主要用于预测来。上图中我们可以看到yhat的值与unwork的值是比较接近的,所以拟合的回归模型还是不错的。

7.回归分析得到残差序列

predict e ,resid  #本命令旨在获得回归后的残差序列

         残差序列是很有用处的。例如,它可以用来检验变量是否存在异方差,也可以用来检验变量间是否存在协整关系等。在后续章节将会进行详细说明,这里不再赘述。

案例延伸

1.在回归方程中不包含常数项

regress unwork inflation,nocon

2.限定参与回归的样本范围

regress unwork inflation if year>=2000

3.关于回归预测

        将数据年份拓展到2008年,假定该年的通货膨胀率为5%,把样本数据输入到数据文件中,然后进行预测,操作命令如下:

predict yyhat

        我们可以预测出了因变量的数据,预测的失业率将会是4.221404%。 

10.2多重线性回归分析

        多重线性回归分析也称多元线性回归分析,多重线性分析涉及到多个自变量,用来处理一个因变量与多个自变量之间的线性关系,建立变量之间的线性模型并根据模型进行评判。

        数据(案例10.2)是为了检验没过电力行业是否存在规模经济,Nerlove(1963)收集了1955年145家没过电力企业的总成本(TC)、产量(Q)、工资率(PL)、燃料价格(PF)、以及资本租赁价格(PK)的数据。试以总成本为因变量,以产量、工资率、燃料价格和租赁价格为自变量,利用多重线性回归扽系方法研究其间的关系。

sum TC Q PL PF PK,detail  #本命令旨在对这些变量进行描述性统计分析correlate TC Q PL PF PK   #本命令的含义主要是观察因变量TC和其他变量之间的相关新关系regress TC Q PL PF PK     #本命令的含义是以TC为因变量进行多重线性回归分析vce                       #本命令的含义是获得参与回归的各自变量的系数以及常数项的方差-协方差矩阵test Q PL PF PK           #本命令的含义是检验各自变量系数的联合显著性predict yhat              #本命令的含义是对因变量的拟合值进行预测predict e, resid          #本命令的含义是获得回归后的残差序列regress TC Q PL PF        #在前面我们的回归分析中我们可以看到PK的系数并不显著所以剔除掉PK

        上述结果不再过多赘述。

案例延伸

1.自动剔除不显著的变量

sw regress TC Q PL PF PK,pr(0.05)


http://chatgpt.dhexx.cn/article/AIHBFmv7.shtml

相关文章

普通最小二乘(OLS)回归

口译: (Interpreting:) OLS (Ordinary Least Squared) Regression is the most simple linear regression model also known as the base model for Linear Regression. While it is a simple model, in Machine learning it is not given much weightage. OLS is one such mo…

最小二乘法:求回归直线方程

最小二乘法:使离差平方和 (i1~n) ∑(yi-yi) 最小的方法 结论:设回归方程为ybxa;解得 回归直线方程:在一组具有相关关系的变量与数据的(x,y)间&#xff0…

最小二乘回归

最小二乘法(Least squares又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟…

离线安装IE 11

转自:http://blog.sina.com.cn/s/blog_711ab1b10102wzq1.html 1、在D盘下,新建文件夹,取名为“ie”。 2、将官网下载的IE11离线包放到此文件夹中。 3、为了后续步骤方便,可以将离线包重命名为IE11.exe。 4、打开cmd窗口&#xff0…

Microsoft Edge离线安装包下载

#Microsoft Edge 现已准备就绪 下一版 Microsoft Edge 已准备好进行企业评估。 立即下载离线安装程序、查看管理策略并尝试 Internet Explorer 模式。 下载链接

安装IE11提示“Internet Explorer在安装前需要更新”

在Windows 7上安装IE11浏览器时,发现如下报错提示: 此问题一般会出现在未安装过更新的windows系统上,一般可以通过系统更新安装补丁的方式来解决,但是系统自带的更新会按照发布顺序将所有微软发布的补丁都安装上,耗费…

安装ie11提示计算机安装了更新的版本,离线安装IE11浏览器提示quot;获取更新quot;解决方法 - 191路由网...

原标题:"Win7系统离线安装IE11浏览器提示"获取更新"如何解决?"相关电脑问题教程分享。 - 来源:网络投稿。  Win7系统离线安装IE11时出现提示“获取更新”如何解决?IE11浏览器是目前IE浏览器已知最高的版本,…

electron离线安装

公司因为安全原因,导致连不上npm的镜像,查找了资料,终于找到一种离线安装 electron 全局开发环境的方法,分享并记录一下: ps: 如果能用淘宝镜像,直接设置npm config set ELECTRON_MIRROR https://npm.taobao.org/mirr…

chrome浏览器离线安装包下载地址

在谷歌官网下载的chrome浏览器,下载的是安装器,要通过联网安装,谷歌浏览器官网:https://www.google.com/intl/zh-CN/chrome/https://www.google.com/intl/zh-CN/chrome/ 最新版本的统一下载链接,通过以下链接下载的都是…

如何下载谷歌浏览器官方最新离线安装包

谷歌浏览器最新离线安装包下载 问题描述 由于工作需要,想在内网机中安装谷歌浏览器,但是内网机是没有网的,所以想着下载一个谷歌浏览器官方最新离线安装包,看似挺简单的工作,但实际上下载还是很麻烦,经过…

【已解决】在Win11上离线安装 .NET Framework 3.5的方法【含网盘离线文件】

随 Windows 11提供的是.NET Framework 4.8,该环境可以运行任何 .NET Framework 4.x 应用。 而.NET Framework 3.5 支持为 .NET Framework 2.0 到 3.5 生成的应用,需要自行安装。 当Win11的应用软件需要.net framework3.5的运行环境时,就会提…

win11电脑安装ie11浏览器

win11系统本身是自带ie11的,只是把这个浏览器屏蔽掉了 首先要替换这两个文件 C:\Windows\System32 和 C:\Windows\SysWOW64 替换之后找到这个目录 把ie右键发送到桌面快捷方式 文件下载链接(0积分):https:…

Windows7安装IE11步骤和中文安装包超简单

此安装包仅限Win7 SP1(Service Pack1)其他本版装不上。 亲测:安装VS2015 提示安装IE10,安装此浏览器可以解决。 链接:https://pan.baidu.com/s/1OhLIlHbkSqXRiwKDjG5fwg 提取码:izd4 示例为win7-64bit…

IE11的安装方法和更新补丁

windows 7操作系统自带IE 8 升级到IE 11的方法 1、查看当前操作系统的系统位数是64位还是32位,这里不在赘述怎么查看,是64位操作系统安装x64文件夹里面的程序,是32位操作系统安装X86文件夹里面的程序; 2、如下如图,依…

IE11离线安装总是提示“获取更新”的解决方法

微软下载的IE11离线包在安装前,必须要先安装必备更新。 首先,先检查操作系统,XP系统是无法安装IE11的,XP支持的最高版本为IE8,如果是XP系统,请先升级到WIN7,旗舰版和专业版均可。 最近在离线安…

ie11离线安装

之前尝试安装过一回,崩溃而卒。今天又遇到组件在ie浏览器中表现异常问题,就决定再来一次,竟然成功了,在这里贴一下成功经验。 由此可知:遇到难题可以先放放,时间会告诉你答案。 安装过程 1.安装补丁 安装…

离线安装.net4.032位_怎样在断网的情况下安装IE11

前言: 虽然美帝对我们各种压榨,虽然我们各种不满,但是被wintel驯化了几十年的国人,如果一下子想放弃这个平台,也是任重而道远的事。今天因为工作又不得不用IE,谨写此文给有需要的朋友。(PS:幸好我们没有被殖民,如果殖民太久,可能几代人过去,连自己的母语都要丢了) 不…

IE11离线安装包ie离线升级ie11离线安装ie11补丁

首先下载ie11离线安装包与补丁文件: 下载地址(我的资源里有):IE11离线安装包下载IE8升级IE11安装补丁离线升级资源-CSDN文库 (如不着急可私信直接要安装包补丁包,我若看到及时回复你) 1、 下载…

【转】模糊测试(fuzzing)是什么

一、说明 大学时两个涉及“模糊”的概念自己感觉很模糊。一个是学数据库出现的“模糊查询”,后来逐渐明白是指sql的like语句;另一个是学专业课时出现的“模糊测试”。 概念是懂的,不外乎是“模糊测试是一种软件测试技术,其核心思想是自动或半…

模糊测试(fuzzing) 概念

看到一个不错的,转来压压惊。 模糊测试(fuzzing)是什么 一、说明 大学时两个涉及“模糊”的概念自己感觉很模糊。一个是学数据库出现的“模糊查询”,后来逐渐明白是指sql的like语句;另一个是学专业课时出现的“模糊测…