拉格朗日乘子

article/2025/8/20 21:07:04

1,拉格朗日乘子(lagrange multiplier),又叫拉氏乘子或拉格朗日乘数。它是出现在拉格朗日乘数法中的概念。

拉格朗日乘数法可以解决多变量函数在其变量受到一个或多个约束条件时求极值的问题。
它可以将含有n个变量的函数(该函数的变量有k个约束条件)的极值问题转化为含有n+k个变量的方程组的解。
实现该方法过程中引入的一个或一组新的未知数就叫拉格朗日乘子。

2,从点到直线的距离说起。

在二维直角坐标系中有一点(m, n)和一条直线ax+by+c=0。现在要求点到直线的距离。
可以用拉格朗日乘数法解决:
点到直线的距离即为点到直线所有点中的那个最小距离。
2.1 在直线上随机取一点(x, y),距离函数为 d = ( m − x ) 2 + ( n − y ) 2 , 约 束 条 件 为 a x + b y + c = 0 d=\sqrt{(m-x)^2+(n-y)^2},约束条件为ax+by+c=0 d=(mx)2+(ny)2 ax+by+c=0
2.2 构建拉格朗日函数: L ( x , y , λ ) = d 2 + λ ( a x + b y + c ) \mathcal{L}(x, y, \lambda)=d^2+\lambda(ax+by+c) L(x,y,λ)=d2+λ(ax+by+c),则函数d的极值点即为函数 d 2 d^2 d2的极值点,即为 L ( x , y , λ ) \mathcal{L}(x, y, \lambda) L(x,y,λ)函数的极值点(这样构造的目的是为了简化计算);
2.3 将 L ( x , y , λ ) \mathcal{L}(x, y, \lambda) L(x,y,λ)的所有偏微分设为0:
2 ( x − m ) + λ a = 0 2(x-m)+\lambda a=0 2(xm)+λa=0
2 ( y − n ) + λ b = 0 2(y-n)+\lambda b=0 2(yn)+λb=0
a x + b y + c = 0 ax+by+c=0 ax+by+c=0
2.4 解得结果为
λ = 2 ( a m + b n + c ) a 2 + b 2 \lambda =\frac{2(am+bn+c)}{a^2+b^2} λ=a2+b22(am+bn+c)
2.5 易求得:
d = ∣ a m + b n + c ∣ a 2 + b 2 d=\frac{|am+bn+c|}{\sqrt{a^2+b^2}} d=a2+b2 am+bn+c

3,求最大熵问题

对于离散分布,有x1, x2,…, xn一共n个点,概率分别为p1, p2, …, pn,构建如下的熵函数:
f ( p 1 , p 2 , . . . , p n ) = − ∑ i = 1 n p i log ⁡ 2 ( p i ) , 约 束 条 件 为 g ( p 1 , p 2 , . . . , p n ) = ∑ i = 1 n p i = 1 f(p1, p2, ..., pn) = -\sum_{i=1}^{n}pi\log_{2}(pi),约束条件为g(p1, p2, ..., pn)=\sum_{i=1}^{n}{pi}=1 f(p1,p2,...,pn)=i=1npilog2(pi)g(p1,p2,...,pn)=i=1npi=1
3.1 构建拉格朗日方程:
L ( p 1 , p 2 , . . . , p n , λ ) = f ( p 1 , p 2 , . . . , p n ) + λ ( g ( p 1 , p 2 , . . . , p n ) − 1 ) \mathcal{L}(p1, p2, ..., pn, \lambda)=f(p1, p2, ..., pn)+\lambda (g(p1, p2, ..., pn) -1) L(p1,p2,...,pn,λ)=f(p1,p2,...,pn)+λ(g(p1,p2,...,pn)1)
3.2 令所有的偏微分为0:
∂ ∂ p i ∣ λ L ( p 1 , p 2 , . . . , p n , λ ) = 0 \frac{\partial}{\partial pi|\lambda} {\mathcal{L}(p1, p2, ..., pn, \lambda)} = 0 piλL(p1,p2,...,pn,λ)=0
上式的含义是对所有变量 ( p 1 , p 2 , . . . , p n , λ ) (p1, p2, ..., pn, \lambda) (p1,p2,...,pn,λ)分别求偏微分,所以一共有n+1个方程。
3.3 上述方程的解为:
− ( l o g 2 p i + 1 l n 2 ) + λ = 0 -(log_2pi + \frac{1}{ln2})+\lambda=0 (log2pi+ln21)+λ=0 for every i
3.4 易得 p i = 1 n pi = \frac{1}{n} pi=n1,所以在均匀分布的情况下能获得最大熵。

4,数值优化问题

Question: 求 y = x 2 在 约 束 条 件 x 2 = 1 下 的 最 小 值 。 求y=x^2在约束条件x^2=1下的最小值。 y=x2x2=1
4.1 直觉法,很显然x在取1或-1时,y的值相等,都为1。
4.2 拉格朗日法
4.21 跟上面一样,构建拉格朗日方程:
L ( x , λ ) = x 2 + λ ( x 2 − 1 ) \mathcal{L}(x, \lambda)=x^2+\lambda(x^2-1) L(x,λ)=x2+λ(x21)
上述方程对应图形为:
在这里插入图片描述
4.22 令所有的偏微分为0:
∂ L ∂ x = 2 x + 2 x λ = 0 \frac{\partial \mathcal{L}}{\partial x}= 2x+2x\lambda=0 xL=2x+2xλ=0
∂ L ∂ λ = x 2 − 1 = 0 \frac{\partial \mathcal{L}}{\partial \lambda}= x^2-1=0 λL=x21=0
容易求出 λ = − 1 时 , \lambda=-1时, λ=1满足条件,此时有两个临界点,如上图所示,但这两个点都是鞍点,需要进一步确定这些点哪个最小值点。
4.23 用数值优化的方法来解决上述问题
构建梯度的平方和的算术平方根函数:
h ( x , λ ) = ( 2 x + 2 x λ ) 2 + ( x 2 − 1 ) 2 h(x,\lambda)=\sqrt{(2x+2x\lambda)^2+(x^2-1)^2} h(x,λ)=(2x+2xλ)2+(x21)2
此函数图像为
在这里插入图片描述
易知道此函数含有最小值点。用数值方法可以来解决损失函数的鞍点问题。

5,拉格朗日乘数法的数学证明

在这里插入图片描述

Reference

https://en.wikipedia.org/wiki/Lagrange_multiplier


http://chatgpt.dhexx.cn/article/yO9DQp91.shtml

相关文章

机器学习中的数学——拉格朗日乘子法(一):等式约束的拉格朗日乘子法

分类目录:《机器学习中的数学》总目录 相关文章: 拉格朗日乘子法(一):等式约束的拉格朗日乘子法 拉格朗日乘子法(二):不等式约束与KKT条件 拉格朗日乘子法是一种寻找多元函数在一组约…

拉格朗日乘子法详解

一、拉格朗日乘子法简介 拉格朗日乘子法的应用十分广泛,它是SVM的理论基础,是凸优化的重要研究部分。它用于求解约束条件下的极值问题,过程简单巧妙,也是各类考试的常考题型。然而,拉格朗日乘子法的原理我却一直模模糊…

日志服务与日志分析工具

系统日志生成服务 功能: 日志服务是根据日志配置文件进行提供相应的功能服务,对于各种服务的信息等级的设定将不同服务的不懂等级信息记录在不同的文件里面。 日志管理服务分类: 1.rsyslogd 普通日志管理服务 采集各种服务产生的信息根据…

Web日志分析

目录 1. Web日志 2. 日志分析技巧 常用分析工具: Apache日志分析技巧: 3. 日志分析案例 1、定位攻击源 2、搜索相关日志记录 3、对找到的访问日志进行解读,攻击者的访问路径..... 4. 日志统计分析技巧 1. Web日志 Web访问日志记录了W…

logparser日志分析详解

Logparser是微软的一款日志分析工具,使用方便功能强大。 支持的日志类型: IISW3C,NCSA,IIS,IISODBC,BIN,IISMSID,HTTPERR,URLSCAN,CSV,TSV,W3C,XML,EVT, ETW,NETMON, REG, ADS, TEXTLINE, TEXTWORD, FS,COM 可输出的文件类型 CSV, TSV, XML, DATAGRID, C…

(分析日志)

日志的分析也是一个很大的概念,可能对于运维和安全人员关注的是系统的所有日志,包括访问日志、系统监测的日志等,但是开发人员对于日志更多的是: 监控系统运行错误,并获取错误时的相关数据包记录重要的信息&#xff0…

日志分析及存储

一、系统日志概述 1.日志的用途 系统和程序的“日记本” −记录系统、程序运行中发生的各种事件 −通过查看日志,了解及排除故障 −信息安全控制的“依据” 2.Linux日志的种类 内核及系统日志 −由系统服务rsyslog统一管理,格式相似 用户日志 …

【linux】——日志分析

文章目录 1. 日志文件1.1 日志文件的分类1.2 日志文件保存位置1.2.1 内核及系统日志1.2.2 日志消息的级别1.2.3 日志记录的一般格式1.2.4 用户日志分析 程序日志分析日志管理策略 远程收集日志 1. 日志文件 1.1 日志文件的分类 ● 日志文件是用于记录Linux系统中各种运行消息的…

python日志分析

日志分析 生产中会出现大量的系统日志、应用程序日志,安全日志等,通过贵日志的分析可以了解服务器的负载,健康状况,可以分析客户的分布情况、客户的行为,甚至基于这些分析可以做出预测。 一般采集流程: 日…

日志分析工具

iis、windows日志做日志分析比较麻烦,这里找到了一款好用的免费的日志分析工具 Log Parser Lizard,下载这个工具之前建议先安装LogParser虽然他会自动弹窗提示。 1. 安装软件 安装没什么好说的一直下一步下一步就行 启动之后点击OK 弹出激活页面让激活…

redis日志分析

首先复习一下IO流: 关于读取文件: BufferedReader 从字符输入流中读取文本,缓冲各个字符,从而提供字符、数组和行的高效读取 InputStreamReader 字节流通向字符流的桥梁 以UTF-8编码读取 FileInputStream 从文件系统中的某…

【日志分析】Web日志分析

ox01 Web日志 Web访问日志记录了Web服务器接收处理请求及运行时错误等各种原始信息。通过对WEB日志进行的安全分析,不仅可以帮助我们定位攻击者,还可以帮助我们还原攻击路径,找到网站存在的安全漏洞并进行修复。 我们来看一条Apache的访问日…

日志分析方法概述

注:写得有点乱,但目前市面上这方面内容的确不多,mark一下~ http://blog.csdn.net/pkueecser/article/details/9569251 大数据应用--系统监控与日志分析 http://wenku.baidu.com/link?url8CJ-URMjVTVaw3GM1AZ2w9A7V0CIeRz3dx7xvysILLk6IdW…

日志分析软件

来源:http://onlyktt.blog.hexun.com/32563117_d.html 在经营管理亿枝客过程中,就遇到了非常多的困难。所以不断的学习知名与不知名互联网创业前辈留下来的经验特别重要,特别是上次与ZAC厦门交流后,以及拜读他写的《网络营销实践密…

简单的Web日志分析

Web日志分析 以apache为例 访问日志记录过程 apache日志大致分为两类:访问日志和错误日志 访问日志记录的过程: 客户端向web服务器发送请求,请求中包含客户端的IP、浏览器类型(User-Agent)、请示的URL等信息 web服务器向客户端返回请示的…

Window日志分析

0x01 Window事件日志简介 Windows系统日志是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。 Windows主要有以下三类日志记录系统事件:应…

LOG日志详解

欢迎关注作者博客 简书传送门 文章目录 Log的用途记录Log的基本原则日志的级别划分日志对性能的影响什么时候输出日志系统启动参数、环境变量异常捕获处函数获得期望之外的结果时关键操作 日志输出的内容什么时候使用J2SE自带的日志 典型问题分析该用日志的地方不用啰嗦重复、没…

日志管理与分析

ISBN: 978-7-121-40632-4 编著:日志易学院 页数:198页 阅读时间:2022-09-25 推荐指数:★★★★☆ 本书是国产日志易团队按照主流的日志管理系统的实践来写的, 讲解了日志分析的基本概念、法律法规、技术选型、采集和解…

Linux日志分析

文章目录 一、系统日志介绍二、rsyslog管理三、实践1.将ssh服务日志单独存放2.远程日志3.排错 一、系统日志介绍 无论你的操作系统是 Windows 还是 Linux ,只要使用操作系统,就都会产生日志。日志可以说记录了你在PC上的一切操作。就像小时候写的日记。…

日志分析方法

日志分析方法 日志分析方法分析方法: 1.特征字符分析(Signature-based):2.访问频率分析(Frequency analysis) 1.漏洞扫描检测:2.暴力破解检测:3.webshell 检测 难点:风险评估模型:参…