线性回归理论说明及公式推导

article/2025/8/24 19:13:18

一切从线性回归说起

线性回归的基本形式
对于一个给定的样本,有n个属性对样本进行描述,则该样本可用一下表达式进行描述:
在这里插入图片描述
其实x为输入,y为输出。而线性回归的主要任务,就是找出x,y之间的关系,我们可以想象为求解一个线性方程。
在线性模型中,我们就可以将最终结果,看作是所有的输入的线性组合,即如下形式:
在这里插入图片描述
这样我们就的得到了线性回归的最基本的模型。为了表达式的简便,我们用同一符号来表示属性,则表达式可做如下形式:
在这里插入图片描述
至此我们就得到了线性回归的最基本模型,线性回归的最终结果可以看作是所有输入共同作用下所得到的输出值。
下图既是线性回归的一个图列说明,我们用一条直线,或者一个平面,一个超平面去对样本进行描述,可以看出我们所需的结果是对整体数据集的一个大致描述,而非准确描述。但这种大致的非准确的描述,恰恰是线性回归的精髓与优势,相比于高阶的回归模型,线性回归在计算上的优势更加突出,同时避免了过拟合现象的发生。
在这里插入图片描述
线性回归求解
根据上面的例子可以看出,线性回归是在给定输入的情况下对于输出值的预测。仅仅就预测值来看,线性回归已经足够优秀,但是确又不可避免地存在误差。
误差分析:
对于每个样本来说,预测值与实际值之间的关系为:
在这里插入图片描述
对于误差所满足的假设条件为:误差是独立同分布的,均值为0,方差为 的高斯分布。举个栗子来说明一下:张三,李四同时去银行贷款,最终贷款多少可能取决于存款,是否有房产,是否有稳定收入等多个因素。此处所说的独立,既张三贷款的多少和李四无关。此处所说的同分布,可以理解为张三李四都在同一家银行贷款。
因为我们的误差函数可写作高斯分布的形式:
在这里插入图片描述
带入误差函数有:
在这里插入图片描述
于是我们可以构造似然函数:
在这里插入图片描述
依据极大似然理论(极大似然理论以及梯度下降法的详细说明见下一博客),此时似然函数的最大值,就是我们所要求的参数 的解。于是我们的任务就转换为似然函数最大值的求解。由于乘积形式计算复杂,求导之后会出现无数项,因为我们把乘积形式换成对数形式,简化计算,构造对数似然函数:
在这里插入图片描述
至此,我们已经无线毕竟最终结果,各位看官再坚持一下,马上就会豁然开朗。
观察上式可以看出,最大化似然函数,其实就是最小化
在这里插入图片描述
依据以上推导,我们找到了线性回归的损失函数形式,由此我们也就得出了各种博客,西瓜书等等各种公式推导教材中的最小二乘法的最基本形式。其几何意义就是直线或平面外一点到直线或者平面的欧式距离的平方,此处也不难理解,用所有点到直线或平面距离的最小值来对该拟合做评估无疑是一个十分恰当的选择。于是我们的问题变成了 的优化问题。
由于博主懒惰,此处略去该函数为凸函数的证明过程,直接进入凸优化三步走,求导,等于零,得解。
在这里插入图片描述
分别令其等于0,于是我们得到了其最优解:
在这里插入图片描述
对于参数的求解,我们的常用方法为梯度下降法,所谓梯度下降,简单理解就是沿着函数的梯度方向,每次走一小步,得到新的位置点,再次计算梯度值,再走一小步,不断迭代,通过多次迭代后得到最优解。
例如目标函数为 ,则其梯度下降即为 ,参数的求解为:
在这里插入图片描述
其中a称为步长,或学习率。关于梯度下降以及极大似然的更多内容将在以后的博客中给出。
小弟才疏学浅,数学基础薄弱,也是一边看一边学,遇到不懂得知识点再去深入学习了解。因此请大家发现错误即时批评指正,万分感谢。愿你在机器学习的路上不孤单,不迷茫。

结尾鸡汤
为山者基于一篑只土,以成千丈之峭。
凿井者起于三寸之坎,以就万仞之深。


http://chatgpt.dhexx.cn/article/spKhoicg.shtml

相关文章

一元线性回归的详细推导过程

下面是一元线性回归的详细求解过程。 假设一元线性回归的最佳直线方程为: (1) 对于一个样本点 ,有预测值为: (2) 这个样本点的真值为 ,要想获得最佳拟合方程,就需要使真值 和 预测值 之间的差值最小,为了…

线性回归基础相关公式

线性回归 通常输入 x 具有多个属性值,翻译过来就是一条数据具有多个特征值。当我们假定最简单的一种情况,也就是说输入只有一个属性值的时候,此时就是一元线性回归。线性回归试图 f(x) wx b,使得 f&…

线性回归原理推导

一、参数公式推导 1、线性回归方程 在三维空间中,决策面/预测函数可表示为:     h θ ( x ) θ 0 θ 1 x 1 θ 2 x 2 h_θ(x)θ_0θ_1x_1θ_2x_2 hθ​(x)θ0​θ1​x1​θ2​x2​,其中 θ 0 θ_0 θ0​是截距,又称偏置项。…

多元线性回归中的公式推导

这次接着一元线性回归继续介绍多元线性回归,同样还是参靠周志华老师的《机器学习》,把其中我一开始学习时花了较大精力弄通的推导环节详细叙述一下。 本文用到的部分关于向量求导的知识可以参看博文标量、向量、矩阵求导 数据集 D{(x1,y1),(x2,y2)⋯(x…

用Excel求线性回归方程

文章目录 一、何为线性回归二、如何制作线性回归最小二乘法 三、利用Excel求线性回归方程操作方法1.选择需要拟合的数据2.点击工具栏的插入,选择插入散点图3.在生成的表格右上角勾选上生成渐近线4.右击生成的渐近线,选择设置渐近线格式5.勾选线性以及显示…

线性回归python实现详解(附公式推导)

目录 1线性回归1.1简单线性回归1.2 多元线性回归的正规方程解1.3 使用梯度下降求解多元线性回归1.4 sklearn中的线性回归模型 1线性回归 1.1简单线性回归 在简单线性回归中,输入x只有一个特征,通过调整a和b的参数值,来拟合从x到y的线性关系。…

机器学习之线性回归原理详解、公式推导(手推)、简单实例

目录 1. 原理详解1.1. 线性回归1.2. 回归系数 2. 公式推导2.1. 单元线性回归2.2. 多元线性回归 3. 简单实例3.1. 实例1:一元线性回归实例2: 多元线性回归3.3. 实例3:房价预测 1. 原理详解 1.1. 线性回归 假设一个空间中有一堆散点&#xff0…

统计学——线性回归公式推导

假设我们有n个点,(x1,y1), (x2,y2), ... ,(xn,yn),如下图所示: 我们要求这几个点的线性回归方程,假设方程为ymxb,如下图所示: 我们的目的是使误差的平方和最小 即求: 的最小值。

计算线性回归、指数回归公式

最近要计算线性回归、指数回归的公式。就整理下吧,以便帮助他人,少走弯路。 发现网上线性回归的资料还算详细,但是指数回归资料很少,还会误导人。 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互…

Python实现线性回归(公式推导+源代码)

写这篇文章之前,首先要对自己做一个小小的反思,很多时候在学习新技术的时候,看到出了什么什么框架,在这个框架上什么什么方法可以直接拿过来用,这样的好处就是我们可以减少写代码量,几个函数就可以帮我们解…

线性回归方程推导

理论推导 机器学习所针对的问题有两种:一种是回归,一种是分类。回归是解决连续数据的预测问题,而分类是解决离散数据的预测问题。线性回归是一个典型的回归问题。其实我们在中学时期就接触过,叫最小二乘法。 线性回归试图学得一个…

线性回归相关知识及公式推导

转自https://www.cnblogs.com/GuoJiaSheng/p/3928160.html 在现实生活中普遍存在着变量之间的关系,有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示,还有一种是属于非确定的(相关),比如人的身高和…

线性模型(二)-- 线性回归公式推导

我们在初中学习线性方程的时候就已经接触过回归的相关概念,在这里简单介绍一下机器学习中的“回归”,机器学习的目的有两个:回归和分类,回归是解决连续数据的预测问题,而分类是为了解决离散数据的预测问题。线性回归是…

一元线性回归公式推导

一元线性回归公式推导 平均损失函数: 对w,b求偏导: 可求解(先求b,再求w): 或: 这两个式子中的w是等价de,可由第一个w分子分母同除n,再由下式得到第二个w: 参考文献: https://zhidao.baidu.com/q…

线性回归模型公式推导

线性回归公式推导 线性模型一、线性回归(一)一元线性回归1. 由最小二乘法得出损失函数2. 证明损失函数 E ( w , b ) E(w,b) E(w,b)是关于 w w w和 b b b的凸函数3. 对损失函数求关于b和w的一阶偏导数4. 令一阶偏导数为0解出 w w w和 b b b (二…

线性回归--公式推导

线性回归 -- LIner regression 线性回归&#xff08;Linear regression&#xff09;是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析 —维基百科 线性回归--理论推导 <1> 数据: 本次推导使用的数据为--银行贷款数据。 &…

线性回归原理及算法

今天给大家的介绍一下线性模型&#xff0c;线性回归模型虽说模型简单&#xff0c;但距今为止依旧在机器学习算法中占据一定的地位&#xff0c;不仅如此&#xff0c;而且在实际的业务应用中也是屡试不爽的机器学习算法。 线性回归模型公式&#xff1a;YXwb &#xff08;一个X变量…

机器学习之线性回归

线性回归是最简单的一个函数拟合过程&#xff0c;一元线性回归公式为yaxb。 我们做拟合&#xff0c;首先需要定义一个损失函数。一般常用的损失函数有&#xff1a;0-1损失函数和绝对值损失函数 0-1损失是指&#xff0c;预测值和目标值不相等为1&#xff0c;否则为0&#xff1a;…

在线Cron表达式生成器,定时任务表达式生成器

近期项目需要在后台管理系统的页面上生成定时任务表达式存入定时任务系统的数据库中&#xff0c;就是那种根据后台管理员指定的时分秒年月日生成一个定时任务表达式。 一时间有点不好下手。我可以根据后台管理员指定的时分秒年月日手动写一个定时任务表达式&#xff0c;也可以…

在线QuartzCron定时任务表达式在线生成

在线QuartzCron定时任务表达式在线生成 在线QuartzCron定时任务表达式在线生成 Quartz是一个完全由java编写的开源作业调度框架,Quartz最主要的功能就是调度器(完成定时任务)。本工具可以在线生成QuartzCron表达式 Quartz是一个完全由java编写的开源作业调度框架,Quartz最主要…