变分法证明两点之间线段最短

article/2025/10/7 19:46:28

传送门https://zhuanlan.zhihu.com/yueaptx

变分法简介Part 1.(Calculus of Variations)

Dr.Stein

Dr.Stein

计算力学

​关注他

283 人赞了该文章

  1. 泛函数 (Functionals)

 

简而言之,泛函数是函数的函数,即它的输入是函数,输出是实数。而这个输出值取决于一个或多个函数(输入)在一整个路径上的积分而非像一般函数一样取决于离散的变量。这样说可能还是比较抽象,不过坚持看到下文的Example 1就可以更好理解了。

通常在变分法中,泛函数是一个积分,记做I

I(y)=\int_{x1}^{x2}Fdx

其中我们想要通过选择被积函数F来最大化或最小化泛函数I的值。同时我们称F为拉格朗日函数(Lagrange function)。F可以是函数y(x)y(x)各阶导数的函数(以下y(x)均简写成y)。为了说明方便,我们先姑且设Fyy'的函数,所以我们可以进一步将泛函数I写成:

I(y)=\int_{x1}^{x2}F(y,y';x)dx

积分里面我用分号;将x和前面的y隔开代表yy'x的函数。一般Fy的函数关系是已知的,所以想要最大或最小化泛函数,实际上是通过选择适当的函数y(x)

为了透彻理解这个概念,我们可以来看一个简单的例子。

Example 1.

一个最简单直观的例子是求两个固定点之间的最短路径。当然大家都知道两点之间直线最短,这里可以用变分法做出解释。

如上图所示路径是一任意路径,我们取区中一小段微元ds,可以容易计算微元断的长度为:

ds^2=dx^2+dy^2=[1+(y')^2]dx^2,即:

ds=\sqrt{1+(y')^2}dx

积分得到总的路径长度为:

L=\int_{x1}^{x2}ds=\int_{x1}^{x2}\sqrt{1+(y')^2}dx

这个例子中,L是泛函数,\sqrt{1+(y')^2}是拉格朗日函数F,我们想要找一个函数y(x)使得泛函数L的值最小。这次Part 1.的任务就是为解决这个问题做准备。Part 2.中我们会用变分法证明这个y(x)确实是直线的方程。

2. 泛函数的极值

 

这里重申下,泛函数I在区间[x_1,x_2]上的值取决于积分路径的选择,即取决于函数y(x)的选择。我们有理由假设存在一个这样的y(x),可以使得泛函数I取到极值。而在这个y(x)附近的任意路径我们记做\tilde{y}(x)。另外,我们假设y(x)两阶可微。通过引入一个微小量\epsilon\ll 1和一个任意可微函数\eta(x),我们可以用y(x)表示\tilde{y}(x):

\tilde{y}(x)=y(x)+\epsilon\eta(x)

这样做的好处是对于一个给定的\eta(x),我们可以通过改变\epsilon的值来得到无穷多的路径,同时对于任何\eta(x),当\epsilon=0的时候,\tilde{y}(x)y(x)重合。

图像直观表示如下图:

由于在边界条件的限制,\eta(x_1)=\eta(x_2)=0。这样就能保证\tilde{y}(x)可以通过两个固定端点。

这时我们可以说,y(x)所对应的泛函数I的值是泛函数\tilde{I}=\int_{x_1}^{x_2}F(\tilde{y},\tilde{y}';x)dx的极值。我们可以进一步用\epsilon表示\tilde{I}

\tilde{I}=\int_{x_1}^{x_2}F(\tilde{y},\tilde{y}';x)dx=\int_{x1}^{x_2}F(y+\epsilon\eta,y'+\epsilon\eta';x)dx

虽然y(x)未知,但是根据之前的合理假设,y(x)是一个存在的确定函数。所以根据上式,如果给定一个特定的\eta(x)\tilde{I}的变化只取决于\epsilon的变化。所以我们现在可以把\tilde{I}看做是\epsilon的函数。用泰勒展开公式将\tilde{I}\epsilon=0处展开得到:

\tilde{I}(\epsilon)=\tilde{I}|_{\epsilon=0}+(\frac{d\tilde{I}}{d\epsilon})\Big|_{\epsilon=0}\cdot\epsilon+ (\frac{d^2\tilde{I}}{d\epsilon^2})\Big|_{\epsilon=0}\cdot\frac{\epsilon^2}{2!} +\cdot \cdot \cdot =\tilde{I}_0+\tilde{I}_1\epsilon+\tilde{I}_2\epsilon^2+\cdot \cdot \cdot

很明显,当\epsilon=0时,\tilde{I}|_{\epsilon=0}=I,带入上式可得到:

\tilde{I}-I=\tilde{I}_1\epsilon+\tilde{I}_2\epsilon^2+\cdot \cdot \cdot

这里我们记\delta I=\tilde{I}_1\epsilon=\frac{d\tilde{I}}{d\epsilon}\Big|_{\epsilon=0}\cdot\epsilon,并称之为一阶变分。同理二阶变分为\delta I^2=\tilde{I}_2\epsilon^2

(这里插一句变分和微分的区别。变分在上图的直观解释是\tilde{y}y在竖直方向上的距离,称之为\delta y,所以这个差是在同一个x上计算的。而微分则是由于x的微小变动引起的y的变动。)

然后我们可以类比求函数极值时的做法。求函数极值时,我们会令函数的一阶导数为零。这里同样,为了求泛函数\tilde{I}的极值,我们令一阶变分\delta I=0。现在我们计算化简\delta I:

\delta I=(\int_{x_1}^{x_2}\frac{d\tilde{F}}{d\epsilon}\Big|_{\epsilon=0} dx)\cdot\epsilon
\frac{d\tilde{F}}{d\epsilon}\Big|_{\epsilon=0} \cdot\epsilon=(\frac{\partial\tilde{F}}{\partial\tilde{y}}\cdot\frac{d\tilde{y}}{d\epsilon}+  \frac{\partial\tilde{F}}{\partial\tilde{y'}}\cdot\frac{d\tilde{y'}}{d\epsilon})\Big|_{\epsilon=0}\cdot\epsilon

因为 \tilde{y}(x)=y(x)+\epsilon\eta(x), 不难得到:\frac{d\tilde{y}}{d\epsilon}=\eta,\frac{d\tilde{y'}}{d\epsilon}=\eta',另外我们有\delta y=\epsilon \eta,\delta y'=\epsilon\eta'

又因为当\epsilon\rightarrow 0时,\tilde{F}\rightarrow 0, \tilde{y}\rightarrow y,\tilde{y}'\rightarrow y',将这些式子带入原式可以得到:

\delta I=\int_{x_1}^{x_2}(\frac{\partial F}{\partial y}\delta y+\frac{\partial F}{\partial y'}\delta y')dx

终于到最后一步啦,分部积分一下得到:

\delta I=\int_{x_1}^{x_2}(\frac{\partial F}{\partial y}-\frac{d}{dx}(\frac{\partial F}{\partial y'} ))\delta ydx+\frac{\partial F}{\partial y'}\delta y\Big|_{x_1}^{x_2}

\delta I=0就可以解得最小化泛函数的y啦。我们注意到\delta I有两个部分。对于第一个积分部分,由于\delta y是任意的,所以要想使这个部分等于零,需要保证^{[1]}

\frac{\partial F}{\partial y}-\frac{d}{dx}(\frac{\partial F}{\partial y'} )=0 (x_1\leq x\leq x_2)

这就是传说中的欧拉-拉格朗日方程(E-L equation)。

而第二部分等于零则是边界条件。

在Part 2., 我们会以用这次介绍的内容和上述方程解决两点之间直线最短的问题为开头,继续介绍变分法。

---------------------------------------------------------------------------------------------------------------------------

注[1]:

假设x_1x_2是给定的常数,\phi(x)是一个特定的在x_1\leq x\leq x_2上连续的函数,那么如果对于任意连续可微的函数\eta(x)都成立\int_{x_1}^{x_2}\phi(x)\eta(x)dx=0,则\phi(x)=0 (x_1\leq x\leq x_2)。

(任意函数和一个非零的特定函数的乘积仍是任意函数,由于无法保证任意函数的积分是零,所以这个特定函数必须在这个区间上恒等于零使得乘积为零,这样可以保证积分为零。)


http://chatgpt.dhexx.cn/article/603BZVRF.shtml

相关文章

最优控制理论 一、变分法和泛函极值问题

变分法是最优控制问题的三大基石之一,下面讨论一些变分法的常用理论。 1. 性能指标泛函 无约束最优控制问题,若固定起止时间,两端状态固定,即 x ( 0 ) x 0 , x ( t f ) x f , t ∈ [ 0 , t f ] x(0)x_0, x(t_f)x_f, t\in[0,t…

[变分法介绍]优美的旋轮线:最速下降线问题,通过费马光学原理的初等证明

[变分法介绍]优美的旋轮线:最速下降线问题,通过费马光学原理的初等证明 变分法 费马光学原理最速下降线问题旋轮线旋轮线最速下降性质的证明一些旋轮线及变形参考书目:1696年约翰伯努利在写给他哥哥雅克布伯努利的一封公开信中提出了如下的“捷线”问题:设想一个质点沿连接…

深入浅出解析变分法——一种常用的数学方法

前言:笔者从事图像处理行业,总是接触到变分法这个概念,一直没有很深入的去理解这个概念,同时我看其他大佬的博文也比较糊涂,因此最近花了一些时间好好梳理了这部分数学知识。文章共3部分,主要是对变分法的解…

变分法:在图像处理中的应用(一)

前言 最近学习稠密重建的相关知识,发现变分法通常作为一个平滑的正则项出现在残差平方和的损失函数中。而图像处理中又经常出现这类最小损失函数的优化问题,如图像分割、稠密光流、稠密重建等等,这些优化问题中都有可能涉及到变分法。因此&am…

电磁仿真原理——3. 变分法(Variationl Methods)

目录 引言线性空间的算子问题变分的计算问题欧拉公式 构造泛函的方法利用分部积分构造利用标准变分原理构造 瑞利一里茨法加权留数法本征问题变分的实际应用 引言 由于课程后面重点的矩量法和有限元法都是基于变分法进行的,变分法是它们的数学基础,实际…

泛函极值问题与变分法

泛函与泛函极值问题 平面内两点A,B,连接两点之间的曲线有很多种方式。分别用函数 f i ( x ) f_{i}(x) fi​(x)来表示。对于给定的曲线 f i ( x ) f_{i}(x) fi​(x), 那么两点之间连线的长度可以表示为 J ( f i ( x ) ) ∫ A B 1 f i ′ ( x ) 2 d x J…

【Matlab】变分法求控制器(无约束)

在动态最优控制中,目标函数是一个泛函数,求解动态最优化问题可以看做是求泛函极值的问题,求解泛函极值有一个方法,即变分法,本文章便介绍有关变分法的一些自己的学习理解。 变分法的基本概念 泛函 如果一个因变量的…

关于变分法

在介绍变分贝叶斯之前,首先以这篇博客介绍下大名鼎鼎的变分法。 参考资料主要是知乎的文章与维基百科。 变分就是函数的微分。 回顾一下传统的函数优化问题。 对于 min ⁡ x f ( x ) \min_x f(x) minx​f(x)这样的优化问题,求取最优的 x x x的做法常用…

变分法

变分法 弦平衡方程的导出,建立起横向位移u,张力T,外力f之间的关系: 方一、根据受力平衡导出 推导时用的技巧或假设: 1.泰勒展开近似 同理 2. 3.小变形假设,张力均匀,即 4.方程推导中忽略二…

变分法入门介绍

文章目录 变分法入门介绍泛函和变分法变分法求泛函极值变分的定义拉格朗日函数欧拉方程 案例分析--两点之间直线最短在Mathematica中使用变分法参考文献 变分法入门介绍 读完这篇博文你可以了解变分的基本概念,以及使用变分法求解最简泛函的极值。本文没有严密的数…

能量原理和变分法笔记1:变分法简介

上个学期在学校学了多体系统动力学的课,其中老师讲了变分原理,觉得很有启发,决定再学学相关的知识,在B站找到了一个这样的视频能量原理与变分法,做点笔记,加深一下理解。 第0章序言-微元、功和能(P2) 第1章…

机器学习——变分法、拉格朗日乘子

文章目录 一、变分法二、Lagrange 乘子2.1 一般约束的拉格朗日乘子2.2 带不等式约束的拉格朗日乘子2.3 多约束问题 一、变分法 引入 函数 y ( x ) y(x) y(x) 可以看成一种操作符,即对于任意 x x x,返回一个输出 y y y。在这种情况下,我们…

动态优化模型/ 变分法:泛函、极值、变分

目录 1 变分法的基本概念 1.1 泛函 1.2 泛函的极值 1.3 泛函的变分 1.4 极值与变分 1.5. 变分法的基本引理 2 无约束条件的泛函极值 2.1 端点固定的情况 2.2 …

变分法 (Calculus of Variations)

Contents 泛函 (functional)Calculus of VariationsReferences 泛函 (functional) 泛函 F [ y ] F[y] F[y] 是函数的函数,即它的输入是函数 y ( x ) y(x) y(x),输出是实数 F F F。这个输出值取决于一个或多个函数 (输入) 在一整个路径上的积分而非像…

变分法原理

原文链接: 浅谈变分法原理 首发于 烤羚羊的理科教室 写文章 浅谈变分原理 烤羚羊 吃老本的物理教师、民科老咸鱼 784 人 赞同了该文章 对付数学物理中极值问题,变分大法(variational principle)可谓是杀人放火居家旅行的必备工具。…

Linux运维工程师岗位前景及学习路线

Linux运维工程师岗位前景及学习路线 1.1 什么是Linux? 大家日常使用电脑听歌、打游戏娱乐或处理日常工作时,接触到最多的就是Windows操作系统,电脑如果不安装Windows系统是无法进行娱乐和工作的,所有的软件程序都必须运行在操作…

猿创征文 | Linux运维工程师的10个日常使用工具分享

猿创征文 | Linux运维工程师的10个日常使用工具分享 一、本次分享工具导航二、Adminer数据库管理工具1.Adminer介绍2.Adminer的特点3.Adminer的使用4.Adminer的使用感受 三、Memos碎片化知识管理工具1.Memos简介2.Memos的使用3.Memos的使用感受 四、Linux服务器集群管理工具——…

Linux运维

目录 第一章、Linux概述 一、Linux的概念 二、Linux的特点 三、Linux VS Windows ​四、Linux的发展优势与存在问题-------不足 五、Linux常用发行版 六、CentOS简介 七、VMWare虚拟机简介 第二章、Linux初示 一、虚拟控制台 二 、Linux启动 (1&#xf…

linux运维工程师到底是做什么的?

linux运维工程师到底是做什么的? 如果你想要进入运维管理领域这一行,首先你应该了解linux运维工程师是干什么的。他主要是对Linux下各种网络服务、应用系统、监控系统等进行自动化脚本开发的工作,并根据项目对系统进行性能优化。 linux运维工程师可以做…

Linux运维工程师必看:如何成为一个合格的运维工程师

如果想成为一名合格的运维工程师,首先我们需要了解运维主要是做什么的?如何成为一个合格的运维工程师? 1、 运维工程师主要是做什么? 运维,很容易从字面理解为运营、维护。 大部分人认为,在互联网公司中运维…