牛顿法与拟牛顿法

article/2025/8/26 16:36:42

牛顿法

求函数的根

牛顿法的最初提出是用来求解方程的根的。我们假设点 x 为函数 f(x) 的根,那么有 f(x)=0 。现在我们把函数 f(x) 在点 xk 处一阶泰勒展开有:

f(x)=f(xk)+f(xk)(xxk)
那么假设点 xk+1 为该方程的根,则有
f(xk+1)=f(xk)+f(xk)(xk+1xk)=0
那么就可以得到
xk+1=xkf(xk)f(xk)
这样我们就得到了一个递归方程,我们可以通过迭代的方式不断的让 x 趋近于x从而求得方程 f(x) 的解。该递归式同样可以通过下图的方式得到:
这里写图片描述
在该图中我们可以看到 xn+1 是要比 xn 更接近于 x ,而 xn+1 利用三角形特征可以知道 xn+1=xnf(xn)f(xn) 。其中, f(xn) 在三角形中表示点 (xn,f(xn)) 处切线的斜率。
牛顿法动图

最优化

对于最优化问题,其极值点处有一个特性就是在极值点处函数的一阶导数为0。因此我们可以在一阶导数处利用牛顿法通过迭代的方式来求得最优解,即相当于求一阶导数对应函数的根。
首先,我们对函数在 xk 点处进行二阶泰勒展开

f(x)=f(xk)+f(xk)(xxk)+12f′′(xk)(xxk)2
f(x)f(xk)xxk=f(xk)+f′′(xk)(xxk)
因此,当 xxk 时, f(x)=f(xk)+f′′(xk)(xxk) 。这里假设点 xk+1 是一阶导数的根,那么就有
f(xk+1)=f(xk)+f′′(xk)(xk+1xk)=0
依据上式可以得到
xk+1=xkf(xk)f′′(xk)
这样我们就得到了一个不断更新 x 迭代求得最优解的方法。这个也很好理解,假设我们上面的第一张图的曲线表示的是函数f(x)一阶导数的曲线,那么其二阶导数就是一阶导数对应函数在某点的斜率,也就是那条切线的斜率,那么该公式就和上面求根的公式本质是一样的。
我们这里讨论的都是在低维度的情形下,那么对于高维函数,其二阶导数就变为了一个海森矩阵,记为 H(x)=[δ2fδxiδxj] ,那么迭代公式就变为了
xk+1=xkH1kfk
我们可以看到,当 Hk 为正定( H1k 也为正定)的时候,可以保证牛顿法的搜索方向是向下搜索的。
牛顿法求最优值的步骤如下:
1. 随机选取起始点 x0
2. 计算目标函数 f(x) 在该点 xk 的一阶导数和海森矩阵;
3. 依据迭代公式 xk+1=xkH1kfk 更新 x
如果E(f(xk+1)f(xk))<ϵ,则收敛返回,否则继续步骤2,3直至收敛
我们可以看到,当我们的特征特别多的时候,求海森矩阵的逆的运算量是非常大且慢的,这对于在实际应用中是不可忍受的,因此我们想能否用一个矩阵来代替海森矩阵的逆呢,这就是拟牛顿法的基本思路。

拟牛顿法

因为我们要选择一个矩阵来代替海森矩阵的逆,那么我们首先要研究一下海森矩阵需要具有什么样的特征才能保证牛顿法成功的应用。通过上面的描述我们知道

f(xk+1)=f(xk)+Hk(xk+1xk)
H1K(f(xk+1)f(xk))=xk+1xk

上式我们称之为拟牛顿条件。
因此,对于我们所选择的替代矩阵 Gk ,需要满足两个条件:

  1. 拟牛顿条件,即 Gk(f(xk+1)f(xk))=xk+1xk
  2. 要保证 Gk 为正定矩阵,这是因为只有正定才能保证牛顿法的搜索方向是向下搜索的

假设 yk=f(xk+1)f(xk) δk=xk+1xk ,因为每次迭代我们都需要更新替代矩阵 Gk ,下面介绍一种常用的迭代算法DFP(Davidon-Fletcher-Powell)

DFP算法

DFP算法中选择 Gk+1 的方法是在每一步迭代中在矩阵 Gk 中加两项附加项构成 Gk+1 ,即

Gk+1=Gk+Pk+Qk
我们有
Gk+1yk=Gkyk+Pkyk+Qkyk
,我们可以令 Pkyk=δk,Qkyk=Gkyk ,这样就可以得到 Gk 的迭代公式


http://chatgpt.dhexx.cn/article/kiPKBMTl.shtml

相关文章

最优化方法总结——梯度下降法、最速下降法、牛顿法、高斯牛顿法、LM法、拟牛顿法

目录 1 最优化方法的结构 2 常用最优化方法对比分析 3 相关计算公式 1 最优化方法的结构 最优化问题的一般形式为&#xff1a; 其中为决策变量&#xff0c;是目标函数&#xff0c;为约束集或可行域。特别地&#xff0c;如果&#xff0c;则最优化问题成为无约束最优化问题。 …

牛顿法与拟牛顿法学习笔记(二)拟牛顿条件

机器学习算法中经常碰到非线性优化问题&#xff0c;如 Sparse Filtering 算法&#xff0c;其主要工作在于求解一个非线性极小化问题。在具体实现中&#xff0c;大多调用的是成熟的软件包做支撑&#xff0c;其中最常用的一个算法是 L-BFGS。为了解这个算法的数学机理&#xff0c…

牛顿法与拟牛顿法学习笔记(一)牛顿法

机器学习算法中经常碰到非线性优化问题&#xff0c;如 Sparse Filtering 算法&#xff0c;其主要工作在于求解一个非线性极小化问题。在具体实现中&#xff0c;大多调用的是成熟的软件包做支撑&#xff0c;其中最常用的一个算法是 L-BFGS。为了解这个算法的数学机理&#xff0c…

最优化学习 拟牛顿法(Quasi-Newton Method)

拟牛顿法&#xff08;Quasi-Newton Method&#xff09; 拟牛顿法&#xff08;Quasi-Newton Method&#xff09;得到矩阵 B k 1 B_{k1} Bk1​获取 B k 1 B_{k1} Bk1​和 H k 1 H_{k1} Hk1​DFP方法(Davidon-Fletche Powell)BFGS方法(Broyden-Fletcher-Goldfarb-Shannon)Broyd…

牛顿法与拟牛顿法(含代码实现)

1. 牛顿法 牛顿法&#xff08;英语&#xff1a;Newton’s method&#xff09;又称为牛顿-拉弗森方法&#xff08;英语&#xff1a;Newton-Raphson method&#xff09;&#xff0c;它是一种在实数域和复数域上近似求解方程的方法。 牛顿法的基本思想是使用函数 f ( x ) {\dis…

拟牛顿法(DFP、BFGS、L-BFGS)

拟牛顿法 一、牛顿法 1.1 基本介绍 牛顿法属于利用一阶和二阶导数的无约束目标最优化方法。基本思想是&#xff0c;在每一次迭代中&#xff0c;以牛顿方向为搜索方向进行更新。牛顿法对目标的可导性更严格&#xff0c;要求二阶可导&#xff0c;有Hesse矩阵求逆的计算复杂的缺…

Quasi-Newton拟牛顿法(共轭方向法)

Quasi-Newton拟牛顿法(共轭方向法) 1. Introduction2. 牛顿法2.1 不能保证收敛2.2 Hessian计算复杂3. 共轭方向法3.1 共轭方向3.2 共轭方向上可以收敛到极小3.3 共轭梯度法得到的是Q上的共轭方向3.4 算法效果4. 拟牛顿法4.1 拟牛顿法构造的是Q的共轭方向4.2 确定Hk - 秩1修正…

BFGS算法

今天&#xff0c;我来讲一种在机器学习中常用到的优化算法&#xff0c;叫做BFGS算法。BFGS算法被认为是数值效果最好的拟牛顿 法&#xff0c;并且具有全局收敛性和超线性收敛速度。那么接下来将会详细讲解。 Contents 1. 什么是拟牛顿法 2. 拟牛顿法原理 3. DFP算法原理 4. BF…

拟牛顿法及其matlab实现

目录 一.前言 二.拟牛顿法的基本思想 三.秩1矫正Hk公式 四.算法步骤 五.代码实现 1.秩1矫正算法 2.目标函数 3.目标函数梯度 4.主函数 六.仿真结果与分析 一.前言 上上上篇文章介绍了牛顿法和修正牛顿法。想看的话可以往后翻。牛顿法有二阶的收敛速度&#xff0c;但He…

InnoDB数据库死锁

目录 场景描述问题分析解决方法延伸&#xff1a;数据库死锁数据库死锁例子 正文 回到顶部 场景描述 在update表的时候出现DeadlockLoserDataAccessException异常 (Deadlock found when trying to get lock; try restarting transaction...)。 回到顶部 问题分析 这个异常并不会…

mysql数据库死锁原因分析

一、死锁模拟复现 1、当前自己电脑的mysql版本8.0.22 2、数据库的隔离级别--可重复读&#xff08;默认隔离级别&#xff09; 3、自动提交关闭 4、表结构&#xff0c;age为非唯一索引&#xff0c;对下面整个案例非常重要 5、 1、事务A执行更新操作&#xff0c;更新成功 2、事务…

处理数据库死锁问题

在实际的项目环境中碰到了如下的问题 Microsoft.Data.SqlClient.SqlException (0x80131904): 事务(进程 ID 98)与另一个进程被死锁在 锁 资源上&#xff0c;并且已被选作死锁牺牲品。请重新运行该事务。 怀疑是因为数据库查询和修改中产生的死锁问题&#xff0c;造成的上述原因…

数据库死锁:原因和解决办法

理解数据库中的死锁 在数据库的上下文中&#xff0c;死锁是指两个或多个事务无法进行的情况&#xff0c;因为每个事务都在等待另一个事务释放资源。这可以类比为事务的循环链&#xff0c;每个事务都在等待链中的下一个事务释放资源。以下是一个死锁场景的视觉表示&#xff1a;…

Java面试必问:死锁(多线程死锁+数据库死锁)

死锁 接下来从几个方面介绍&#xff1a; 多线程死锁多线程死锁解决办法数据库死锁数据库死锁解决办法 多线程死锁是怎么造成的&#xff1f; 多线程锁定同一资源会造成死锁线程池中的任务使用当前线程池也可能出现死锁 参考连接&#xff1a; https://blog.csdn.net/qq_3506…

MySQL数据库死锁了,该怎么办?一文全解最新教程

文章目录 正文死锁的发生为什么会产生死锁&#xff1f;Insert 语句是怎么加行级锁的&#xff1f;1、记录之间加有间隙锁2、遇到唯一键冲突 如何避免死锁&#xff1f; 之前分享过 MySQL 死锁的文章&#xff0c;然后很多读者对「插入意向锁」认识很迷糊。 大家误以为「插入意向锁…

5 分钟理解数据库死锁

图片来源&#xff1a;网络 文章目录 死锁是如何产生的&#xff1f;如何解决并避免死锁总结 &#x1f37a;知人者智&#xff0c;自知者明。胜人者有力&#xff0c;胜己者强。知足者富&#xff0c;强行者有志。不失其所者久&#xff0c;死而不亡者寿。——老子 大家好&#xff01…

数据库死锁场景

场景一&#xff1a; 单一线程多次进入子事务发生死锁 问题&#xff1a; 线上问题发生了死锁&#xff0c;但通过死锁日志发现一直在等待查询结果。我们使用的数据库是PGsql&#xff0c;默认的隔离级别是“读已提交”&#xff0c;按理来说查询不会加锁&#xff0c;导致一度被带偏…

数据库常见死锁原因及处理

目录 前言什么是死锁死锁产生的四个必要条件 1. 表锁死锁死锁场景解决方案建议 2. 行锁死锁2.1 两个事务分别想拿到对方持有的锁&#xff0c;互相等待&#xff0c;于是产生死锁死锁场景解决方案 2.2 共享锁转换为排他锁死锁场景解决方案 3. INSERT ... ON DUPLICATE KEY UPDATE…

数据库死锁分析与解决

一、死锁的表现 1、错误信息是:事务(进程 ID)与另一个进程被死锁在 锁 资源上&#xff0c;并且已被选作死锁牺牲品。请重新运行该事务。 2、错误信息是:事务(进程 ID )与另一个进程被死锁在 锁 | 通信缓冲区 资源上&#xff0c;并且已被选作死锁牺牲品。请重新运行该事务。 二、…

数字 IC 技能拓展(1)Xilinx_Vivado_SDK_2019.1 安装详细教程

引言 工欲善其事必先利其器&#xff0c;而君之“器”尚无&#xff0c;就更别谈“事”了。赶紧&#xff01;我们需要下载并安装一个 Xilinx Vivado 软件&#xff01;&#xff01;接下来就飞速地开始我们的 Xilinx_Vivado_SDK_2019.1 详细安装教程&#xff01;&#xff01;&#…