3.2 知识点复习

3.2.1 Taylor公式

重要概念回顾 Taylor展开:设fCr,则fx0处带Lagrange余项的Taylor展开为(1)f(x0+v)=f(x0)+k=1r11k!i1,,ik=1nkfxikxi1(x0)vi1vik+1r!i1,,ir=1nrfxirxi1(x0+θv)vi1vir 其中v0θ(0,1)。根据fr阶偏导数的连续性可得(2)f(x0+v)=k=0r1k!i1,,ik=1nkfxikxi1(x0)vi1vik+o(vr)

重要定理回顾

(1)

Taylor多项式的唯一性:设fCrf是满足degPr的多项式,若(3)f(x)P(x)=o(xx0r),xx0Pfx0处的r阶Taylor多项式。

(2)

低阶Taylor展开:(4)f(x0+v)=f(x0)+f(x0),v+12v,Hf(x0)v+o(v2) 其中Hf(x0)fx0处的Hesse矩阵。

应用 ln(1+x+y+z)在原点附近的Taylor展开。

3.2.2 凹凸性

重要概念回顾

(1)

凸集、凸函数、严格凸函数。

(2)

凹函数、严格凹函数。

(3)

Hesse矩阵。

(4)

最大值、最大值点、最小值、最小值点。

(5)

极大值、极大值点、极小值、极小值点。

(6)

驻点:满足f(x0)=0的点x0

重要定理回顾

(1)

f:DRC2,则xD

  • Hf(x)正定f严格凸;fHf(x)半正定;
  • Hf(x)负定f严格凹;fHf(x)半负定。
(2)

f:DRC2凸,则(5)f(x)f(x0)+f(x0)(xx0),x0,xD

(3)

Fermat引理:设f在极值点处可微,则x0f的驻点。

(4)

极值判定:设f:DRC2x0f的驻点。

  • Hf(x0)正(负)定,则x0f的极小(大)值点。
  • Hf(x0)非退化且既不正定也不负定,则x0f的鞍点。
  • Hf(x0)退化,则需要进一步判断,如更高阶的Taylor展开等。
(5)

条件极值:设f,g1,,grC1xf在约束g1==gr=0下的条件极值点,则存在λ1,,λrR使得(x,λ1,,λr)F:(x,λ1,,λr)f(x)i=1rλigi(x)的驻点,亦即(6)f(x)=i=1rλigi(x)

(6)

条件极值判定:设(x,λ)F的驻点。

  • F(x,λ)处的Hesse矩阵H限制在切空间Tx(Σ)上正定,亦即(7)v,Hv>0,vTx(Σ){0}xf在给定约束下的(严格)极小值点。
  • 若限制在切空间上的H负定,则xf在给定约束下的(严格)极大值点。
  • 若限制在切空间上的H非退化且既不正定也不负定,则xf在给定约束下的鞍点。
  • 若限制在切空间上的H退化,则需要进一步判断。

应用

(1)

函数f(x,y)=xyln(x2+y2)(补充定义f(0,0)=0)的极值(点)、最值(点)。

(2)

方程F(x,y,z)=x(1+yz)+exp(x+y+z)1=0在原点附近确定了隐函数z=f(x,y)

(3)

函数f(x,y,z)=xy+yz+xz在约束x,y,z>0xyz=1下的条件极值。

与一元微积分不同的是,设f:DRDRn上可微,xf的唯一驻点且为严格极小值点,则f不一定在x处取得最小值;f甚至可能无下界,如f(x,y)=e3x+y33yex

3.2.3 *Hesse矩阵

我们已知在任意基底下的表示,那么Hesse矩阵的表示又是怎样的呢?

定理 3.2.1 f:RnRC2,则fx0Rn处的Hesse矩阵可表示为(8)Hf(x0)=(f)(x0)

此处的Hesse矩阵实际上是一个映射RnRn,并不依赖于坐标系;出于习惯,我们仍称其为矩阵。在证明此式时,千万不能代入f的分量表示,尤其是标准正交基——因为微分和梯度都是不依赖于坐标系的!

证明 由于fC2,故存在(对称且关于x0连续的)Hesse矩阵Hf(x0)满足(9)f(x0+v)=f(x0)+f(x0),v+12v,Hf(x0)(v)+o(v2) 同理可得(10)f(x0)=f(x0+v)f(x0+v),v+12v,Hf(x0+v)(v)+o(v2) 两式相加可得(11)f(x0+v)f(x0),v=12v,Hf(x0+v)(v)+Hf(x0)(v)+o(v2)Hf(x0)关于x0的连续性可得(12)Hf(x0+v)Hf(x0):=maxu0Hf(x0+v)(u)Hf(x0)(u)u=o(1) 故有(13)|v,Hf(x0+v)(v)Hf(x0)(v)|vHf(x0+v)(v)Hf(x0)(v)=o(v2) 因此(14)f(x0+v)f(x0),v=v,Hf(x0)(v)+o(v2)=v,(f)(x0)(v)+o(v2)Hf的唯一性1Hf(x0)=(f)(x0)

3.2.4 *Laplace算子(1)

Rn的直角坐标系中,Laplace算子的定义为(15)Δ=i=1n2xi2 一种很自然的想法是猜测(16)Δf(x)=?trHf(x) 很可惜,这在绝大多数情况下是不正确的。我们来具体探讨它在什么情况下成立。

Laplace算子的标准定义为(17)Δf=divgradf 由于Laplace算子的定义涉及散度,我们将在后续章节中详细讨论,此处我们直接给出它的表达式:(18)Δf=1detGxi(detGgijfxj) 根据先前的讨论,我们有(19)[Hf(v)]k=[(f)(v)]k=j(fk)ξj=j(gkllf)ξj 计算可得(20)v,Hf(v)=ξivi,vk[Hf(v)]k=ξigikj(gkllf)ξj(Hf)ij=gikj(gkllf) 因此(21)trHf=(Hf)ii=giki(gkllf)=gikxi(gkjfxj) 对比ΔftrHf的表达式可得两者相等的充分条件:

以上两个条件限制(x1,,xn)必须为直角坐标系的正交变换。

例 3.2.2 证明Laplace算子在任意坐标系中的表达式:(22)Δf=1detGxi(detGgijfxj)

证明 此处我们借助直角坐标系,采用暴力计算证明。简单起见,除了用gij表示(G1)ij以外,我们不使用上下指标,但仍采用Einstein求和约定。

设从Rn的直角坐标系(x1,,xn)变换到任意坐标系(x1,,xn)的Jacobi矩阵为J,即(23)Jij=xixj,jf=ifJij,G1=JJT,±detG=1detJ 代入Laplace算子的直角坐标表达式中可得(24)Δf=kkf=i(jfJjk)Jik=ijfJikJjk+jfiJjkJik=gijijf+jfiJjkJik 另一方面,计算可得(25)Δf=?detJi(gijjfdetJ)=idetJdetJJikJjkjf+i(gijjf)=idetJdetJJikJjkjf+gijijf+jf(iJikJjk+JikiJjk) 故原题等价于证明:(26)idetJdetJJikJjkjf+jfiJikJjk=0 经过适当的等价变形,我们尝试证明其充分条件(去掉对j,k的求和):(27)iJikdetJ=0,k 由于J可逆,设A=J1,则Aij=jxi,故(下式中已将k换成j(28)JijdetJ=(A1)ijdetA=(adjA)ij 故该充分条件等价于证明:(29)i(adjA)ij=0,j

从此处开始不再使用Einstein求和约定。设si={1,,n}{i}Sn1(si)表示由si生成的对称群,注意到(30)(adjA)ij=(1)i+jdetMji=(1)i+jσiSn1(si)sgn(σi)k=1n1σi(k)xsj(k) 故有(31)i=1ni(adjA)ij=(1)ji=1nσiSn1(si)k=1n1(1)isgn(σi)iσi(k)xsj(k)=1,kn1σi()xsj() 固定i,σi,k,选择i(i),σi满足(32)i=σi(k),σi(k)=i,σi()=sj(),k 亦即(33)σi{1,,i1,i+1,,n}={σi(1),,σi(k)=i,,σi(n1)}σi{1,,i1,i+1,,n}={σi(1),,σi(k)=i,,σi(n1)} 容易发现这样的(i,σi)(i,σi)是一一对应的。不妨设i<i,则有(34)σi1σi{1,,i1,i+1,,i1,i,i+1,,n}={1,,i1,i,i+1,,i1,i+1,,n} 相当于i向前移动了ii1个单位!故有(35)sgn(σi)=(1)ii1sgn(σi)(1)isgn(σi)+(1)isgn(σi)=0 i<i亦同理。综上所述,我们有(36)(1)isgn(σi)iσi(k)xsj(k)=1,kn1σi()xsj()+(1)isgn(σi)iσi(k)xsj(k)=1,kn1σi()xsj()=0(i,σi)(i,σi)的贡献相互抵消,故i(adjA)ij=0,证毕。

(未完待续)

3.2.5 *Euler-Lagrange方程

Euler-Lagrange方程是变分法的基础,它研究的是这样一类问题:

定理 3.2.3 设函数q:RRnC1满足边界条件q(a)=xaq(b)=xb,定义积分形式的泛函F:C1(R×Rn)R(37)F[f]=abL(t,q(t),q˙(t))dt 则当泛函F取得极值时,q满足Euler-Lagrange方程(38)LqiddtLq˙i=0,i=1,,n

证明q是泛函F的极值点,令q=q+q~,则q~需满足边界条件q~(a)=q~(b)=0。定义函数Φ:RR(39)Φ(ε)=F[q+εq~]=abL(t,q+εq~,q˙+εq~˙)dtΦ求导可得(40)Φ(0)=ddε|ε=0abL(t,q+εq~,q˙+εq~˙)dt=abε|ε=0L(t,q+εq~,q˙+εq~˙)dt=i=1nab(Lqi(t,q,q˙)q~i+Lq˙i(t,q,q˙)q~˙i)dt 由于ε=0Φ的极值点,由Fermat引理可知2(41)i=1nab(Lqiq~i+Lq˙iq~˙i)dt=0,q~ 式中有两个自由度q~,q~˙,可通过分部积分消去q~˙(42)i=1n[ab(LqiddtLq˙i)q~idt+Lq˙iq~i|t=ab]=0,q~ 结合q~的边界条件可得(43)i=1nab(LqiddtLq˙i)q~idt=0,q~q~的任意性可得(44)LqiddtLq˙i=0,i=1,,n

我们举一个简单的例子。

例 3.2.4 证明:两点之间(所有C1的连线中),线段最短。

证明 简单起见,我们在R2上考虑这个问题,并设yxC1函数;其余情况基本同理。设两点的坐标为A(x1,y1)B(x2,y2),则连线的长度为(45)L=x1x21+(dydx)2dx 由Euler-Lagrange方程可得(46)LyddxLy=0 因此(47)ddx(y1+y2)=0y1+y2=Cy=consty为直线,即“两点之间,线段最短”。

1这里Hf(x0)(f)(x0)都是对称映射。

2方便起见,以下将L(t,q,q˙)简写为L