泛函与泛函极值问题
平面内两点A,B,连接两点之间的曲线有很多种方式。分别用函数 f i ( x ) f_{i}(x) fi(x)来表示。对于给定的曲线 f i ( x ) f_{i}(x) fi(x), 那么两点之间连线的长度可以表示为
J ( f i ( x ) ) = ∫ A B 1 + f i ′ ( x ) 2 d x J(f_{i}(x))=\int\limits_{A}^B\sqrt{1+f'_{i}(x)^2}dx J(fi(x))=A∫B1+fi′(x)2dx
这里 J J J是函数 f f f的函数,又叫泛函。通过求 J J J的极值,求得对应的 f ( x ) f(x) f(x),就是泛函的极值问题。求泛函极值问题常用的方法就是变分法。
变分法和欧拉-拉格朗日方程
考虑泛函(functional)常见形式
J = ∫ x 1 x 2 F ( x , y ( x ) , y ′ ( x ) ) d x J=\int\limits_{x_1}^{x_2} F(x,y(x),y'(x))dx J=x1∫x2F(x,y(x),y′(x))dx
其中
- x 1 x_1 x1, x 2 x_2 x2是常数;
- y ( x ) y(x) y(x)二阶连续可微函数;
- y ′ ( x ) = d y / d x y'(x)=dy/dx y′(x)=dy/dx;
- F ( x , y ( x ) , y ′ ( x ) ) F(x,y(x),y'(x)) F(x,y(x),y′(x))是关于变量 x x x, y y y, y ′ y' y′的二阶连续可微函数。
假如泛函 J [ y ] J[y] J[y]在 f f f处取得局部极小值,对于任意函数 η ( x ) \eta(x) η(x), 有一阶导数且在 η ( x 1 ) = η ( x 2 ) = 0 \eta(x_1)=\eta(x_2)=0 η(x1)=η(x2)=0, 对于趋近于0的任意小的数 ε \varepsilon ε,有:
J [ f ] ≤ J [ f + ε η ] J[f]\leq J[f+\varepsilon\eta] J[f]≤J[f+εη]
其中, ε η \varepsilon\eta εη就是函数 f f f的变分,用 δ f \delta f δf来表示。
用 f + ε η f+\varepsilon\eta f+εη替换泛函 J [ y ] J[y] J[y]中的 y y y,结果就是 ε \varepsilon ε的一个函数:
Φ ( ε ) = J [ f + ε η ] \Phi(\varepsilon)=J[f+\varepsilon\eta] Φ(ε)=J[f+εη]
因为函数 J J J在 f f f处取得极小值,所以函数 Φ ( ε ) \Phi(\varepsilon) Φ(ε)在 ε = 0 \varepsilon=0 ε=0处取得极小值,因此,
Φ ′ ( 0 ) ≡ d Φ d ε ∣ ε = 0 = ∫ x 1 x 2 d F d ε ∣ ε = 0 d x = 0 \Phi'(0)\equiv\frac{d\Phi}{d\varepsilon}\bigg|_{\varepsilon=0}=\int_{x_1}^{x_2}\frac{dF}{d\varepsilon}\bigg|_{\varepsilon=0}dx=0 Φ′(0)≡dεdΦ∣∣∣∣ε=0=∫x1x2dεdF∣∣∣∣ε=0dx=0
对泛函 F ( x , y , y ′ ) F(x,y,y') F(x,y,y′)求全微分,其中 y = f + ε y=f+\varepsilon y=f+ε, y ′ = f ′ + ε η ′ y'=f'+\varepsilon\eta' y′=f′+εη′都是 ε \varepsilon ε的函数,但是 x x x不是(即, d x d ε = 0 \frac{dx}{d\varepsilon}=0 dεdx=0),所以有:
d F d ε = ∂ F ∂ y d y d ε + ∂ F ∂ y ′ d y ′ d ε \frac{dF}{d\varepsilon}=\frac{\partial{F}}{\partial{y}}\frac{dy}{d\varepsilon}+\frac{\partial{F}}{\partial{y'}}\frac{dy'}{d\varepsilon} dεdF=∂y∂Fdεdy+∂y′∂Fdεdy′
因为 d y d ε = η \frac{dy}{d\varepsilon}=\eta dεdy=η, d y ′ d ε = η ′ \frac{dy'}{d\varepsilon}=\eta' dεdy′=η′,所以有:
d F d ε = ∂ F ∂ y η + ∂ F ∂ y ′ η ′ \frac{dF}{d\varepsilon}=\frac{\partial{F}}{\partial{y}}\eta+\frac{\partial{F}}{\partial{y'}}\eta' dεdF=∂y∂Fη+∂y′∂Fη′
因此
∫ x 1 x 2 d F d ε ∣ ε = 0 d x = ∫ x 1 x 2 ( ∂ F ∂ f η + ∂ F ∂ f ′ η ′ ) d x = ∫ x 1 x 2 ( ∂ F ∂ f η + d d x ( ∂ F ∂ f ′ η ) − η d d x ∂ F ∂ f ′ ) d x ( 分 部 积 分 ) = ∫ x 1 x 2 ( ∂ F ∂ f η − η d d x ∂ F ∂ f ′ ) d x + ∂ F ∂ f ′ η ∣ x 1 x 2 \begin{aligned} \int_{x_{1}}^{x_2}\frac{dF}{d\varepsilon}\bigg|_{\varepsilon=0}dx & =\int_{x_1}^{x_2}\bigg(\frac{\partial{F}}{\partial{f}}\eta+\frac{\partial{F}}{\partial{f'}}\eta'\bigg)dx \\ & =\int_{x_1}^{x_2}\bigg(\frac{\partial{F}}{\partial{f}}\eta+\frac{d}{dx}(\frac{\partial{F}}{\partial{f'}}\eta)-\eta\frac{d}{dx}\frac{\partial{F}}{\partial{f'}}\bigg)dx \quad(分部积分)\\ & = \int_{x_1}^{x_2}\bigg(\frac{\partial F}{\partial f}\eta-\eta\frac{d}{dx}\frac{\partial F}{\partial f'}\bigg)dx+\frac{\partial F}{\partial f'}\eta\bigg|_{x_1}^{x_2} \end{aligned} ∫x1x2dεdF∣∣∣∣ε=0dx=∫x1x2(∂f∂Fη+∂f′∂Fη′)dx=∫x1x2(∂f∂Fη+dxd(∂f′∂Fη)−ηdxd∂f′∂F)dx(分部积分)=∫x1x2(∂f∂Fη−ηdxd∂f′∂F)dx+∂f′∂Fη∣∣∣∣x1x2
当 ε = 0 \varepsilon=0 ε=0时, F [ x , y , y ′ ] → F [ x , f , f ′ ] F[x,y,y']\to F[x,f,f'] F[x,y,y′]→F[x,f,f′]。因为 η ( x 1 ) = η ( x 2 ) = 0 \eta(x_1)=\eta(x_2)=0 η(x1)=η(x2)=0,且公式左边等于0,所以有:
∫ x 1 x 2 η ( x ) ( ∂ F ∂ f − d d x ∂ F ∂ f ′ ) d x = 0 \int_{x_1}^{x_2}\eta(x)\bigg(\frac{\partial F}{\partial f}-\frac{d}{dx}\frac{\partial F}{\partial f'}\bigg)dx=0 ∫x1x2η(x)(∂f∂F−dxd∂f′∂F)dx=0
根据变分法基本定理,知道:
∂ F ∂ f − d d x ∂ F ∂ f ′ = 0 \frac{\partial F}{\partial f}-\frac{d}{dx}\frac{\partial F}{\partial f'}=0 ∂f∂F−dxd∂f′∂F=0
这个公式即为欧拉-朗格朗日方程( Euler-Lagrange)。欧拉-拉格朗日方程还可以推广至多元和高阶,在偏微分方程和微分几何领域有广泛的应用前景。
变分法典型应用
最短距离问题
针对一开始提出的最短距离问题,其泛函表示形式为:
J ( f ( x ) ) = ∫ A B 1 + f ′ ( x ) 2 d x J(f(x))=\int\limits_{A}^B\sqrt{1+f'(x)^2}dx J(f(x))=A∫B1+f′(x)2dx
即
F ( x , y , y ′ ) = 1 + f ′ ( x ) 2 F(x,y,y')=\sqrt{1+f'(x)^2} F(x,y,y′)=1+f′(x)2
∂ F ∂ f = 0 \frac{\partial F}{\partial f}=0 ∂f∂F=0
∂ F ∂ f ′ = f ′ ( x ) 1 + f ′ ( x ) 2 \frac{\partial F}{\partial f'}=\frac{f'(x)}{\sqrt{1+f'(x)^2}} ∂f′∂F=1+f′(x)2f′(x)
d d x ∂ F ∂ f ′ = f ′ ′ ( x ) ( 1 + f ′ ( x ) 2 ) − 3 2 \frac{d}{dx}\frac{\partial F}{\partial f'}=f''(x)(1+f'(x)^2)^{-\frac{3}{2}} dxd∂f′∂F=f′′(x)(1+f′(x)2)−23
根据欧拉公式,得: f ′ ′ ( x ) = 0 f''(x)=0 f′′(x)=0
所以:
f ′ ( x ) = a f'(x)=a f′(x)=a
f ( x ) = a x + b f(x)=ax+b f(x)=ax+b
其中 a , b a,b a,b为与起始点相关的常数。即两点之间直线最短。