变分法:从原理到应用
需了解差分、微分的区别和联系需了解偏微分和全微分、导数和偏导数、梯度和方向梯度的联系需了解微分、导数、梯度的关系需了解偏微分和全微分的表示方法我们在学习微积分的过程中接触到了微分的概念,它是研究函数的一个非常重要的概念,今天笔者所介绍的变分法是基于微积分的一种更加高阶的数学方法,其主要目的是求解泛函的极值,在数学和物理学等众多领域得到了广泛的应用。本文从函数的驻点、泛函的定义、变分原理的推导和变分
原文链接:https://zhuanlan.zhihu.com/p/653627629
前言
需了解差分、微分的区别和联系
需了解偏微分和全微分、导数和偏导数、梯度和方向梯度的联系
需了解微分、导数、梯度的关系
需了解偏微分和全微分的表示方法
变分法简介
我们在学习微积分的过程中接触到了微分的概念,它是研究函数的一个非常重要的概念,今天笔者所介绍的变分法是基于微积分的一种更加高阶的数学方法,其主要目的是求解泛函的极值,在数学和物理学等众多领域得到了广泛的应用。
本文从函数的驻点、泛函的定义、变分原理的推导和变分原理的简单应用四个方面对变分法的原理和应用作简要的介绍,以加深对读者变分法的理解。
1.函数的驻点
驻点往往是极值存在的点,在求解函数f(x)f(x)f(x)在定义域内的极值时,我们常会找函数的驻点。下面介绍函数的驻点是如何得到的。
对于一个三维空间域上的函数f(x)f(x)f(x),给定一个位移的增量Δx=(x1,x2,x3)\Delta x=(x1,x2,x3)Δx=(x1,x2,x3),根据泰勒展开可以得到:
f(x+Δx)=f(x)+∂f∂x1Δx1+∂f∂x2Δx2+∂f∂x3Δx3+o(x)f(x+\Delta x)=f(x)+\frac{\partial f}{\partial x_1}\Delta x_1 +\frac{\partial f}{\partial x_2}\Delta x_2 +\frac{\partial f}{\partial x_3}\Delta x_3 + o(x)f(x+Δx)=f(x)+∂x1∂fΔx1+∂x2∂fΔx2+∂x3∂fΔx3+o(x)
因此我们可以得到:
Δf=f(x+Δx)−f(x)=∂f∂x1Δx1+∂f∂x2Δx2+∂f∂x3Δx3+o(x)\Delta f=f(x+\Delta x)-f(x)=\frac{\partial f}{\partial x_1}\Delta x_1 +\frac{\partial f}{\partial x_2}\Delta x_2 +\frac{\partial f}{\partial x_3}\Delta x_3 + o(x)Δf=f(x+Δx)−f(x)=∂x1∂fΔx1+∂x2∂fΔx2+∂x3∂fΔx3+o(x)
考虑∣Δx∣→0|\Delta x|\to0∣Δx∣→0,忽略高阶项,我们得到:
df=∇f⋅dxdf=\nabla f \cdot dxdf=∇f⋅dx
对于任何方向的dxdxdx,函数的一阶微分df=0df=0df=0,那么只有:
∇f=0\nabla f=0∇f=0
这表示函数的驻点处梯度为0。
2.泛函的定义
对于函数的定义我们已经比较了解,函数实际上就是一个数集映照到另外一个数集的对应法则。设函数 y=y(x)y=y(x)y=y(x) 定义在 a<x<ba<x<ba<x<b 上,那么每一个定义域内的都有唯一的与之对应。 现在我们看一下下面的表达式:
F=∫ab[y(x)]3+y′(x)y′′(x)dxF=\int_a^b[y(x)]^3+y'(x)y''(x)dxF=∫ab[y(x)]3+y′(x)y′′(x)dx
毫无疑问,FFF的值与xxx是无关的,那么与谁有关呢?与yyy这个函数有关!只要yyy这个法则发生变化,它在积分区域所有的值一般都会变化,FFF的值当然也会变化。所以说泛函并不是一个很复杂的概念,泛函就是函数的函数。它只是把普通函数的自变量从数换成了函数,也就是一个法则。当然我们也可以从另一个角度理解泛函,我们知道多元函数具有多个自变量,例如:
g=g(x1,x2,x3)g=g(x_1,x_2,x_3)g=g(x1,x2,x3)
这里的ggg 是一个三元函数,其中任意一个自变量变化都会引起函数值改变。不过多元函数的自变量都是有限的,而泛函可以看成是拥有无限个自变量的多元函数,函数 yyy 在 a<x<ba<x<ba<x<b 这个区间中的所有函数值构成了它的自变量集合。无论怎么理解泛函,简单的泛函都可以用以下的形式表示:
F[y]=∫abf(x,y,y′)dxF[y]=\int_a^bf(x,y,y')dxF[y]=∫abf(x,y,y′)dx
这里说简单泛函是因为只涉及到一阶导数和一重积分,更复杂的泛函可能包含更高阶导数以及多重积分。
(算子是一个函数到另一个函数的映射,它是从 向量空间到向量空间的映射,泛函是从 向量空间到数域的映射,函数是从 数域到数域的映射。)
3.变分原理的推导
很多物理问题本质上都是求泛函的极值。例如:一个在铅直平面的小球从高点A到达低点B,通过怎样的路径所用的时间最短?直觉上我们可能认为走A到B的线段最短,然而事实并非如此,这就是著名的的最速降线问题(也叫作捷线问题),后面会详细讲述这个问题。
一条两端固定自然悬挂的均质绳索,在重力作用下会呈现怎样的形状?这是有名的悬链线问题,本质上还是使得悬链线的重力势能最小化。光线在连续不均匀介质中的传播路径是怎样的?由于光在宏观上总是沿光程最短的路径传播,所实质上还是求泛函的最小值问题。
泛函相比与函数有很多不同的地方,因此求泛函的极值需要借助新的工具,然而从原理上,我们仍然可以借鉴求驻点的方法。我么考虑一个典型的泛函:
F[y]=∫abf(x,y,y′)dxF[y]=\int_a^bf(x,y,y')dxF[y]=∫abf(x,y,y′)dx
并且有:函数yyy在a和ba和ba和b两端的值是固定的。
这里我们给定函数 yyy 附近任意一个微小的变化 δy=y∗−y\delta y=y^*-yδy=y∗−y,(类似Δx=x′−x\Delta x=x'-xΔx=x′−x),我们称之为变分。考虑到泛函FFF必须停驻,则泛函的变分δF=0\delta F=0δF=0.现在我们推导δF\delta FδF的表达式:
δF=F[y+δy]−F(y)\delta F=F[y+\delta y]-F(y)δF=F[y+δy]−F(y)
=∫abf(x,y+δy,y′+δy′)dx−∫abf(x,y,y′)dx=\int_a^b f(x,y+\delta y,y'+\delta y')dx-\int_a^bf(x,y,y')dx=∫abf(x,y+δy,y′+δy′)dx−∫abf(x,y,y′)dx泰勒展开保留第一项
=∫ab[f(x,y,y′)+∂f∂ydy+∂f∂y′dy′]dx−∫abf(x,y,y′)dx=\int_a^b[f(x,y,y')+\frac{\partial f}{\partial y}dy+\frac{\partial f}{\partial y'}dy']dx-\int_a^bf(x,y,y')dx=∫ab[f(x,y,y′)+∂y∂fdy+∂y′∂fdy′]dx−∫abf(x,y,y′)dx
=∫ab[∂f∂ydy+∂f∂y′dy′]dx=\int_a^b[\frac{\partial f}{\partial y}dy+\frac{\partial f}{\partial y'}dy']dx=∫ab[∂y∂fdy+∂y′∂fdy′]dx使用分部积分
=[∂f∂y′δy]∣ab+∫ab[∂f∂y−ddx(∂f∂y′)δy]dx=[\frac{\partial f}{\partial y'}\delta y]|_a^b+\int_a^b[\frac{\partial f}{\partial y}-\frac{d}{dx}(\frac{\partial f}{\partial y'})\delta y]dx=[∂y′∂fδy]∣ab+∫ab[∂y∂f−dxd(∂y′∂f)δy]dx
=∫ab[∂f∂y−ddx(∂f∂y′)]δydx=\int_a^b[\frac{\partial f}{\partial y}-\frac{d}{dx}(\frac{\partial f}{\partial y'})]\delta ydx=∫ab[∂y∂f−dxd(∂y′∂f)]δydx
在aaa 和bbb 两端点处有 δy=0\delta y=0δy=0,是因为在这里函数 y(x)y(x)y(x)是固定的。上式中对于任意的可能变分 δy(x)\delta y(x)δy(x)要使得δF=0\delta F=0δF=0 ,当且仅当:
∂f∂y=ddx(∂f∂y′)\frac{\partial f}{\partial y}=\frac{d}{dx}(\frac{\partial f}{\partial y'})∂y∂f=dxd(∂y′∂f)
这就是欧拉-拉格朗日方程,也是通过变分原理求泛函极值应用最广的方程。
更多推荐
所有评论(0)