2.2 知识点复习

2.2.1 大O和小o

重要概念回顾 O、同阶,o、等价。

重要定理回顾f,g:ERm,则f=O(g)等价于fk=O(gk),(k),其中fk,gkf,g的第k个分量。

应用 以下设x0

(1)

线性映射:Ax=O(x)

(2)

二次型:Ax,x=O(x2)

多元多项式的阶不能简单地认为是单项式的最高次幂,如xy=O(x2+y2),但反过来不成立。因此多元微积分中没有的概念,只有同阶,如x2+y22x2+3y2同阶。

阶的概念实际上是这么引入的:我们想研究一元函数f:RR在一点x0附近的行为,可以用单项式(xx0)n来近似,近似效果最好的单项式的次数n就是f的阶,如图2.2.1(a)所示。如果n为整数,这就是Taylor展开的主项次数。

但在多元微积分中,函数f:RmRx0附近的行为无法完全用xx0n来近似,如图2.2.1(b)所示。如果一定要用多项式来近似的话,可以用多元Taylor展开的思想,写成i!,i2,,inai1,i2,,in(x1x01)i1(x2x02)i2(xnx0n)in

PIC
(a) f(x)=xsinx0附近的行为
PIC
(b) f(x,y)=xy(0,0)附近的行为
图 2.2.1: 一元函数与多元函数的阶

2.2.2 可导与可微

重要概念回顾

(1)

可导(可微):称f:ERpx0处可导(可微),若存在线性映射A:RmRp使得f(x0+h)=f(x0)+Ah+o(h)。记A=:f(x0)。若p=1,则通常记为df(x0)

(2)

沿向量的导数f:ERp沿v的导数为fv(x0):=limt0+f(x0+tv)f(x0)t。若v=1,则称为方向导数

重要定理回顾

(1)

如果fx0处可微,则f在任意方向的方向导数都存在,且成立(1)fv(x0)=f(x0)(v)

(2)

链式法则:设F:ERpG:RpRqFx0处可微,Gy0=F(x0)处可微,则GFx0处可微,且成立(2)(GF)(x0)=G(y0)F(x0)

(3)

Leibniz公式:(3)d(f(x)g(x))=f(x)dg(x)+g(x)df(x)d(f(x)g(x))(v)=f(x)g(x)(v)+g(x)f(x)(v)

应用

(1)

常映射、线性映射均为可微函数。

(2)

内积:设f(x)=Ax,x,则f(x0)=x0T(A+AT)

(3)

方阵:设f(A)=A1,则f(A)(B)=A1BA1

(4)

复合内积:设F,Gx0处可微,则H(x):=F(x),G(x)x0处可微,且H(x0)(v)=F(x0)(v),G(x0)+F(x0),G(x0)(v)

(5)

行列式:det(A)(B)=tr(ATB)

(1)

微分是线性映射,导数相当于线性映射的矩阵表示。

(2)

以上定义与一元微积分相容。f(x0)相当于一个等比例函数(也是线性映射),f(x0)相当于一个矩阵。

(3)

f:RRm表示m维空间中的位矢,则f(t)表示速度。

(4)

在方向导数的定义中一定要注意t0+t0表示的是相反方向的方向导数。

(5)

v=vu,则v=vu

(6)

如果f在任意方向的方向导数都存在,f甚至可以不连续,如f(x,y)=x2+y2arctanyx(补充定义f(0,0)=0)。

(7)

导数和方向导数的几何意义如图2.2.2所示。

PIC
(a) 导数的几何意义
PIC
(b) 方向导数的几何意义
图 2.2.2: 导数和方向导数的几何意义

2.2.3 偏导数

重要概念回顾

(1)

偏导数:设f:ERp{v1,,vm}Rm的一组基,对应的坐标向量为(x1,,xm)T,则fx0处的偏导数为(4)fxi(x0)=limt0f(x0+tvi)f(x0)t 通常选择标准正交基{e1,,em}

(2)

Jacobi矩阵:设f:ERp,则fx0处的Jacobi矩阵为(5)f(x0)=(f1x1(x0)f1x2(x0)f1xm(x0)f2x1(x0)f2x2(x0)f2xm(x0)fpx1(x0)fpx2(x0)fpxm(x0))=:Jf(x0)

重要定理回顾

(1)

全微分:设f:RmR{v1,,vm}Rm的一组基,对应的坐标向量为(x1,,xm)Tdxi:xxi是坐标映射函数,则fx0处微分为(6)df(x0)=i=1mfxi(x0)dxi 此时的微分又称为全微分,此定理又称一阶微分的形式不变性。

(2)

链式法则(7)(GF)(x0)=G(F(x0))F(x0) 等价于(8)J(GF)(x0)=JG(F(x0))JF(x0)(9)(y1yn)=F(x1,,xm),(z1zl)=G(y1,,yn)(10)zixj=k=1nziykykxj,i,j

(3)

f可微f连续,f可微f的所有偏导数存在。

(4)

如果f的所有偏导数在U上都连续,则fU上可微。条件可放宽为:至多有1个偏导数存在。

应用 正交坐标系(直角坐标系、极/柱坐标系、球坐标系)变换的Jacobi矩阵。

(1)

导数是函数本身的性质,不依赖于坐标系的选取。链式法则是复合函数导数的计算方法。

(2)

Jacobi矩阵(偏导数)是导数在特定坐标系下的矩阵表示,依赖于坐标系的选取。链式法则可以转换为Jacobi矩阵的乘法。

(3)

全微分是特定映射(即陪域为R,多元函数)的微分,描述了微分(线性函数)与坐标映射函数的关系。

(4)

容易证明:在Rm的任意基底下,Jacobi矩阵(全微分)的形式保持不变。

(5)

偏导数的符号常常让人困惑,例如:设f(x,y)=x+y,则fx(x,x)究竟是1还是2?我个人倾向于1fx表示的是f对第一个变量求偏导后的函数,随后代入这个函数在(x,x)处的值。对于另一种答案,我会用xf(x,x),f(x,x)x来表示。有时候为了避免歧义,会使用1f来表示对第一个变量求偏导。

2.2.4 梯度

重要概念回顾f:ER,则fx0处的梯度为(11)f(x0)=(fx1(x0)fxm(x0)),=(x1xm)

重要定理回顾

(1)

Riesz表示定理:设E是有限维实内积空间,f:ER连续线性泛函,则存在唯一的aE使得f(x)=a,x

(2)

梯度与微分、方向导数的关系:(12)fv(x0)=df(x0)(v)=f(x0),v

(3)

(fG)(x)=(JG(x))Tf(G(x))

(4)

Leibniz公式:(13)(f(x)g(x))=f(x)g(x)+g(x)f(x)(f(x)g(x))=(Jg(x))Tf(x)+(Jf(x))Tg(x)

应用

(1)

内积:设f(x)=Ax,x,则f(x0)=(A+AT)x0

(2)

行列式:det(A)=A,矩阵内积的定义为A,B=tr(ATB)

(1)

梯度是线性函数f(x0)E=Rm中的内积表示。

(2)

梯度方向是函数的方向导数最大的方向,即函数值增长最快的方向;梯度的大小是函数最大的方向导数值。

2.2.5 高阶偏导数

重要概念回顾{v1,,vm}Rm的一组基,对应的坐标向量为(x1,,xm)T,函数f:RmR,则fx0处的k阶偏导数为(14)kfxikxik1xi1=xikxik1fxi1(x0),i1,,ik{1,,m}

重要定理回顾

(1)

如果函数f的所有k阶偏导数都连续,记作fCk,则fk阶偏导数的值与求导顺序无关。

(2)

设函数f,gCkλ,μR,则λf+μg,fgCk

(3)

设函数fCk、映射GCk(意为G的每一个分量GiCk),则fGCk

应用

(1)

计算平面Laplace算子Δ=2x2+2y2在极坐标系下的表示。

(2)

证明:矩阵求逆算子f:AA1在其定义域内是C的。

(1)

k阶偏导数共有mk个。

(2)

k=2时,设m×m矩阵H满足Hij=2fxjxi,则H称为Hessian矩阵。

(3)

当高阶偏导数的值与求导顺序无关时,偏导数可简写为kfxmαmx1α1,其中α1++αm=k

2.2.6 *协变与逆变

U={u1,,um}V={v1,,vm}Rm的两组基,从VU的基变换矩阵B满足(15)ui=j=1mvjbji(u1um)=(v1vm)B 易知B可逆。

现在我们考虑向量wV,U这两组基上展开的坐标向量,分别记作x=(x1,,xm)Ty=(y1,,ym)T。假设x,y之间存在变换(16)y=Axyi=j=1maijxj 注意到(17)w=i=1myiui=i=1m(j=1maijxj)(k=1mvkbki)=k=1m(j=1mi=1mbkiaijxj)vk=k=1m(j=1m(BA)kjxj)vk=k=1mxkvk 故有(18)j=1m(BA)kjxj=xk,k,xRmBA=IA=B1 由此证明了“若A存在,则A=B1”,代入验证即可得到A的存在性。因此坐标向量的变换形式为(19)y=B1x 它的变换矩阵是基变换矩阵的逆矩阵。我们把所有类似坐标向量变换方式的变换称为逆变

现在我们考虑偏导数算子xi的变换,根据链式法则易得(20)yi=j=1mxjyixj 由于x=By,故有(21)xj=i=1mbjiyixjyi=bjiyi=j=1mxjbji 因此偏导数算子的变换形式为(22)(y1ym)=(x1xm)B 它的变换矩阵和基变换矩阵相同。我们把所有类似基变换方式的变换称为协变。全微分算子d是协变算子。

逆变指标一般写在上标位置,协变指标一般写在下标位置,我们后面也将采用此记号。

2.2.7 *曲面坐标系(1)

Rn中,利用我们熟悉的直角坐标系1(x,y,z)=:(x1,,xn),可以定义曲面坐标系(x1,,xn)(23)xi=xi(x1,,xn),i=1,,n 上式就是直角坐标系到曲面坐标系的坐标变换。为保证x1,,xn相互独立,应当要求Jacobi矩阵可逆,即(24)detJ=det(x1,,xn)(x1,,xn)0

例 2.2.1 柱坐标系(ρ,ϕ,z)、球坐标系(r,θ,ϕ)(如图2.2.3所示)与直角坐标系(x,y,z)的坐标变换为(25)(x,y,z)=(ρcosϕ,ρsinϕ,z)(x,y,z)=(rsinθcosϕ,rsinθsinϕ,rcosθ)

PIC PIC

图 2.2.3: 柱坐标系与球坐标系

有了坐标系后,我们就可以定义坐标系的基向量:

定理 2.2.2 容易验证:gi,gj=δij

定义空间的度规G(26)gij=gji=gi,gj,G=(gij)n×n 与此同时,定义(27)gij=gji=gi,gj 容易验证G1=(gij)n×n

对空间的任意一点,如果通过该点的三个坐标面总是互相垂直的,这个坐标系就称为正交曲面坐标系。坐标面垂直等价于其法向量gi相互垂直,亦即G1为对角矩阵。因此

定理 2.2.3 如果度规G是对角矩阵,则此坐标系为正交曲面坐标系;此时正交归一基ei=gihi,其中hi=gi=gii;物理分量满足A^i=Aihi

度规与(微元)弧长也存在联系。计算可知2(28)ds2=i.jgijdxidxj=gijdxidxj 在我们熟悉的直角坐标系Rn中,有(29)ds2=dx12++dxn2

例 2.2.4 直角坐标系、柱坐标系、球坐标系均为正交曲面坐标系。请分别写出直角坐标系、柱坐标系、球坐标系下的弧长表达式。

计算可知(30)ds2=dx2+dy2+dz2ds2=dρ2+ρ2dϕ2+dz2ds2=dr2+r2dθ2+r2sin2θdϕ2 在实际运用中,可不必计算、依赖朴素的物理直觉得到以上三式。

利用定义式计算度规较为麻烦,在实际运用中通常会借助坐标变换的Jacobi矩阵来计算度规。

定理 2.2.5 设从直角坐标系(x1,,xn)变换到(x1,,xn)的Jacobi矩阵为J,则度规与Jacobi矩阵的关系为(31)G=(JJT)1

证明 已知Jacobi矩阵的定义为(32)Jij:=xixj 由于Jacobi矩阵可逆,因此(33)(J1)ij=xixjdxi=(J1)ijdxj 弧长的定义为(34)ds2=dxkdxk=(J1)ki(J1)kjdxidxj=[(J1)TJ1]ijdxidxj=(JJT)ij1dxjdxj=gijdxjdxj 因此(35)gij=(JJT)ij1

(未完待续)

2.2.8 *全微分与梯度

度规可以帮助我们得到正交曲面坐标系下的梯度算符。

定理 2.2.6 d是梯度算符的协变微分形式。在正交曲面坐标系中,设u为函数,则(36)du=iuxidxiu=iuxieigii

证明 证明参考3。设r为正交曲面坐标系中的一点,定义xi方向的单位向量为ei,其满足(37)hi=rxi=gii,ei=1hirxidr的全微分可表示为(38)dr=irxidxi=ihieidxi 故有(39)ei,dr=hieidxi,ei=hidxiu为函数,则du的全微分可表示为(40)du=iuxidxi=i1hiuxiei,dr=i1hiuxiei,dr 根据Riesz表示定理,存在唯一的u使得(41)du=u,dr 因此(42)u=i1hiuxiei=iuxieigii

在更一般的坐标系中,我们有下面的结论:

例 2.2.7 {v1,,vm}Rm中的一组基,对应的坐标向量为(x1,,xm)T,试用xi,(i=1,,m)来表示梯度算子

v=ξ1v1++ξmvmf(x0)=c1v1++cmvm,则(43)df(x0)(v)=f(x0),v=i=1mcivi,j=1mξjvj=i=1mj=1mcivi,vjξj=(c1cm)(v1,v1v1,vmvm,v1vm,vm)(ξ1ξm) 记度规G:=(vi,vj)m×m,由(全)微分的定义可知(44)df(x0)(v)=i=1mfxi(x0)ξi=(fx1(x0)fxm(x0))(ξ1ξm) 因此(45)f(x0)=G1(fx1(x0)fxm(x0))=G1(x1xm){v1,,vm}是标准正交基时,G=I

由此我们发现=G1dT,此即梯度在协变基向量下的坐标向量表示。在此基础上,我们可以进一步证明:

定理 2.2.8 V,URm的两组基,对应的坐标向量分别为x,y,两者之间的坐标变换满足(46)U=VBy=B1x 则有(47)dy=dxB,y=B1x 亦即在协变基向量的坐标表示下,全微分算子d是协变的,梯度算子是逆变的。

证明 由链式法则可得(48)dy=dxxy=dxBz为直角坐标系,令JV=xzJU=yz,则有B=xy=xzzy=JVJU1,且(49)x=JVJVTdxT,y=JUJUTdyT,dy=dxBdyT=JUTJVTdx 计算可得(50)y=JUJUTJUTJVT(JVJVT)1x=JUJV1=B1x

在正交曲面坐标系中,正交归一基更为常用,此时梯度的物理分量表示为(51)u=G1i=1muxihiei=i=1muxieigii

2.2.9 *线性映射的伴随

A:RnRmm×n矩阵,A的转置矩阵AT:RmRn的定义为(AT)ij=Aji。然而,对于一般的线性映射,以上定义不便操作,故我们可借助内积来定义线性映射的伴随。设A:UV是线性映射,则A的伴随映射AT:VU也是个线性映射,其满足(52)Au,vV=u,ATvU,uU,vV 容易证明这个定义与矩阵转置的定义等价。方便起见,以下省略内积的下标。

线性映射与其伴随的Jacobi矩阵满足什么关系呢?

U={u1,,un}V={v1,,vm}分别是U,V的一组基,对应的坐标向量为(x1,,xn)T(y1,,ym)T,记Aui=i=1nvjaji,则有(53)j=1nAjxivj=Axi(x0)=limt0A(x0+tui)A(x0)t=Aui=j=1nvjajiAjxi=aji(54)A~:=JA=(aij)n×nAxi(x0)=Aui=j=1nvjA~ji,x0U 同理(55)ATyj(y0)=ATvj=i=1muiAT~ij,y0V 注意到(56)k=1mui,ukAT~kj=ui,ATvjU=vj,Aui=k=1nvj,vkVA~ki 记度量矩阵MU:=(ui,uj)n×nMV:=(vi,vj)m×m,它们都是对称矩阵,则上式可写为(57)MUAT~=(MVA~)TAT~=MU1A~TMVU,V为标准正交基时,MU=IMV=I,此时AT~=A~T