普通最小二乘(OLS)回归

article/2025/10/7 15:10:33

口译: (Interpreting:)

OLS (Ordinary Least Squared) Regression is the most simple linear regression model also known as the base model for Linear Regression. While it is a simple model, in Machine learning it is not given much weightage. OLS is one such model which tells you much more than only the accuracy of the overall model. It also tells you how each variables have fared, if we have unwanted variables, if there is autocorrelation in the data and so on.

OLS(普通最小二乘)回归是最简单的线性回归模型,也称为线性回归的基础模型。 尽管它是一个简单的模型,但是在机器学习中却没有太多的权重。 OLS就是这样一种模型,它告诉您的不仅是整个模型的准确性。 它还告诉您每个变量的运行情况,是否有不需要的变量,数据中是否存在自相关等。

It is also one of the easier and more intuitive techniques to understand, and it provides a good basis for learning more advanced concepts and techniques. This post explains how to perform linear regression using the statsmodels Python package.

它也是一种更容易理解,更直观的技术,并且为学习更高级的概念和技术提供了良好的基础。 这篇文章说明了如何使用statsmodels Python软件包执行线性回归。

Note: There is also a Logit Regression which is similar to Sklearn’s Logistic Regression and works for classification problems.

注意:还有一个Logit回归,类似于Sklearn的Logistic回归,适用于分类问题。

OLS reflects the relationship between X and y variables following the simple formula:

OLS按照以下简单公式反映X和y变量之间的关系:

Y = b1X +b0 #Simple Linear

Y = b1X + b0#简单线性

𝑦 = b0 + b1X1 + b2X2…. + 𝜀 #Multi Linear

𝑦= b0 + b1X1 + b2X2…。 + 𝜀#多线性

Where

哪里

· b0 — y — intercept

·b0 — y —截距

· b1,b2 — slope

·b1,b2 —斜率

· X, X1, X2 — predictor

·X,X1,X2-预测变量

· y — Target variable

·y-目标变量

OLS is an estimator in which the values of b1 and b0 (from the above equation) are chosen in such a way as to minimize the sum of the squares of the differences between the observed dependent variable and predicted dependent variable. That’s why it’s named ordinary least squares.

OLS是一种估计器,其中b1和b0的值(根据上述方程式)的选择方式应使所观察到的因变量与预测因变量之间的差平方和最小。 这就是为什么它被称为普通最小二乘法。

Also when the model is trying to reduce the error rate between predicted and actual, it means its trying to cut down on losses and predict better. You are trying to predict the impact of your predictors on the results.

同样,当模型试图降低预测和实际之间的错误率时,这意味着它试图减少损失并更好地进行预测。 您正在尝试预测预测变量对结果的影响。

Note: Ideally before computing the model building using OLS, the linear assumptions need to be met. The aim of this article is to interpret all the elements in an OLS model.

注意:理想情况下,在使用OLS计算模型构建之前,需要满足线性假设。 本文的目的是解释OLS模型中的所有元素。

Lets understand this better looking at this example, I have taken a simple dataset — Advertising data:

让我们通过下面的示例更好地了解这一点,我采用了一个简单的数据集-广告数据:

Image for post
Data in consideration. Data shape is 200x4
考虑数据。 数据形状为200x4

In linear models, the coefficient of 1 variable is dependent on other independent variables. Hence if there is a reduction or addition in the data, it will affect the whole model. For example, suppose in the future, we also have another advertising medium say Social Media, we will have to re-fit and re-calculate the coefficients and the constants as they are dependent on dimensions of the dataset.

在线性模型中,1变量的系数取决于其他自变量。 因此,如果数据减少或增加,则会影响整个模型。 例如,假设在将来,我们还有另一种广告媒体,例如“社交媒体”,我们将不得不重新拟合和重新计算系数和常数,因为它们取决于数据集的维数。

In case you want to check out the formula for multi linear regression:

如果您想查看用于多元线性回归的公式:

So practically, it’s not feasible to keep adding variables and checking their linear relationship. The idea is to pick the best of variables using the following 2 steps:

因此,实际上,不断添加变量并检查它们的线性关系是不可行的。 这个想法是通过以下两个步骤来选择最佳变量:

1. Domain Knowledge

1.领域知识

2. Statistical tests — Not only the parametric and non-parametric tests but also check if there is multicollinearity between independent variables and correlation with target variables.

2.统计检验-不仅要进行参数检验和非参数检验,还要检查自变量与目标变量之间的相关性是否存在多重共线性。


http://chatgpt.dhexx.cn/article/k5CRaSHD.shtml

相关文章

最小二乘法:求回归直线方程

最小二乘法:使离差平方和 (i1~n) ∑(yi-yi) 最小的方法 结论:设回归方程为ybxa;解得 回归直线方程:在一组具有相关关系的变量与数据的(x,y)间&#xff0…

最小二乘回归

最小二乘法(Least squares又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟…

离线安装IE 11

转自:http://blog.sina.com.cn/s/blog_711ab1b10102wzq1.html 1、在D盘下,新建文件夹,取名为“ie”。 2、将官网下载的IE11离线包放到此文件夹中。 3、为了后续步骤方便,可以将离线包重命名为IE11.exe。 4、打开cmd窗口&#xff0…

Microsoft Edge离线安装包下载

#Microsoft Edge 现已准备就绪 下一版 Microsoft Edge 已准备好进行企业评估。 立即下载离线安装程序、查看管理策略并尝试 Internet Explorer 模式。 下载链接

安装IE11提示“Internet Explorer在安装前需要更新”

在Windows 7上安装IE11浏览器时,发现如下报错提示: 此问题一般会出现在未安装过更新的windows系统上,一般可以通过系统更新安装补丁的方式来解决,但是系统自带的更新会按照发布顺序将所有微软发布的补丁都安装上,耗费…

安装ie11提示计算机安装了更新的版本,离线安装IE11浏览器提示quot;获取更新quot;解决方法 - 191路由网...

原标题:"Win7系统离线安装IE11浏览器提示"获取更新"如何解决?"相关电脑问题教程分享。 - 来源:网络投稿。  Win7系统离线安装IE11时出现提示“获取更新”如何解决?IE11浏览器是目前IE浏览器已知最高的版本,…

electron离线安装

公司因为安全原因,导致连不上npm的镜像,查找了资料,终于找到一种离线安装 electron 全局开发环境的方法,分享并记录一下: ps: 如果能用淘宝镜像,直接设置npm config set ELECTRON_MIRROR https://npm.taobao.org/mirr…

chrome浏览器离线安装包下载地址

在谷歌官网下载的chrome浏览器,下载的是安装器,要通过联网安装,谷歌浏览器官网:https://www.google.com/intl/zh-CN/chrome/https://www.google.com/intl/zh-CN/chrome/ 最新版本的统一下载链接,通过以下链接下载的都是…

如何下载谷歌浏览器官方最新离线安装包

谷歌浏览器最新离线安装包下载 问题描述 由于工作需要,想在内网机中安装谷歌浏览器,但是内网机是没有网的,所以想着下载一个谷歌浏览器官方最新离线安装包,看似挺简单的工作,但实际上下载还是很麻烦,经过…

【已解决】在Win11上离线安装 .NET Framework 3.5的方法【含网盘离线文件】

随 Windows 11提供的是.NET Framework 4.8,该环境可以运行任何 .NET Framework 4.x 应用。 而.NET Framework 3.5 支持为 .NET Framework 2.0 到 3.5 生成的应用,需要自行安装。 当Win11的应用软件需要.net framework3.5的运行环境时,就会提…

win11电脑安装ie11浏览器

win11系统本身是自带ie11的,只是把这个浏览器屏蔽掉了 首先要替换这两个文件 C:\Windows\System32 和 C:\Windows\SysWOW64 替换之后找到这个目录 把ie右键发送到桌面快捷方式 文件下载链接(0积分):https:…

Windows7安装IE11步骤和中文安装包超简单

此安装包仅限Win7 SP1(Service Pack1)其他本版装不上。 亲测:安装VS2015 提示安装IE10,安装此浏览器可以解决。 链接:https://pan.baidu.com/s/1OhLIlHbkSqXRiwKDjG5fwg 提取码:izd4 示例为win7-64bit…

IE11的安装方法和更新补丁

windows 7操作系统自带IE 8 升级到IE 11的方法 1、查看当前操作系统的系统位数是64位还是32位,这里不在赘述怎么查看,是64位操作系统安装x64文件夹里面的程序,是32位操作系统安装X86文件夹里面的程序; 2、如下如图,依…

IE11离线安装总是提示“获取更新”的解决方法

微软下载的IE11离线包在安装前,必须要先安装必备更新。 首先,先检查操作系统,XP系统是无法安装IE11的,XP支持的最高版本为IE8,如果是XP系统,请先升级到WIN7,旗舰版和专业版均可。 最近在离线安…

ie11离线安装

之前尝试安装过一回,崩溃而卒。今天又遇到组件在ie浏览器中表现异常问题,就决定再来一次,竟然成功了,在这里贴一下成功经验。 由此可知:遇到难题可以先放放,时间会告诉你答案。 安装过程 1.安装补丁 安装…

离线安装.net4.032位_怎样在断网的情况下安装IE11

前言: 虽然美帝对我们各种压榨,虽然我们各种不满,但是被wintel驯化了几十年的国人,如果一下子想放弃这个平台,也是任重而道远的事。今天因为工作又不得不用IE,谨写此文给有需要的朋友。(PS:幸好我们没有被殖民,如果殖民太久,可能几代人过去,连自己的母语都要丢了) 不…

IE11离线安装包ie离线升级ie11离线安装ie11补丁

首先下载ie11离线安装包与补丁文件: 下载地址(我的资源里有):IE11离线安装包下载IE8升级IE11安装补丁离线升级资源-CSDN文库 (如不着急可私信直接要安装包补丁包,我若看到及时回复你) 1、 下载…

【转】模糊测试(fuzzing)是什么

一、说明 大学时两个涉及“模糊”的概念自己感觉很模糊。一个是学数据库出现的“模糊查询”,后来逐渐明白是指sql的like语句;另一个是学专业课时出现的“模糊测试”。 概念是懂的,不外乎是“模糊测试是一种软件测试技术,其核心思想是自动或半…

模糊测试(fuzzing) 概念

看到一个不错的,转来压压惊。 模糊测试(fuzzing)是什么 一、说明 大学时两个涉及“模糊”的概念自己感觉很模糊。一个是学数据库出现的“模糊查询”,后来逐渐明白是指sql的like语句;另一个是学专业课时出现的“模糊测…

sulley测试环境搭建的相关总结

忙活了几天,在师兄的指导下也算是OK啦,下面来说一句具体的搭建过程,基本是按照python灰帽子那本书的第九章来弄的,在网上的话可以参考这里: http://blog.chinaunix.net/uid-25979788-id-1747694.html 基本上就是书上的电子版了…