5.6 最优控制

5.6.1 动态系统

动态系统的最优控制问题是指在动态系统的约束下,求解某个目标泛函的最优值。我们首先给出动态系统的定义7

定义 5.6.1 (动态系统) ΩRnURm,记BA={f:AB},随时间演化的(一阶)动态系统由以下部分组成:

1.

时间tT=[t0,+)

2.

状态空间ΩRn非空、开,状态变量xΩT以及初始状态x(t0)=x0

3.

控制空间URm非空,控制变量uUT

4.

由当前状态和控制变量决定的(一阶)状态方程 (1)x˙(t)=f(t,x,u),xΩT, uUT, tT 其中f:T×ΩT×UTRn称为系统的动力学函数,满足f,fx均连续。

控制变量的含义是每个时刻能施加到系统上的可控量(油门、推力、转矩、舵角、施加电压、消费率……)。动态系统的目标泛函通常不仅与系统演化的过程x(t)与控制变量u(t)有关,还与系统的终端状态xf:=x(tf)有关,形式为:

定义 5.6.2 (目标泛函) 设动态系统由(T,Ω,U,f,x0)组成,定义其目标泛函为 (2)J[x,u,tf,xf]:=Φ(tf,xf)+t0tfL(t,x,u)dt 其中tf为终端时间、xf:=x(tf)为终端状态,L:T×ΩT×UTR为运行成本函数,Φ:T×ΩR为终端成本函数,满足L,Lx以及Φ,Φt,Φx均连续。

动态系统的目标是通过调节控制变量u(t),使得系统状态x(t)沿着某条最优轨迹演化,从而使得某个目标泛函取得最优值。动态系统的最优控制问题定义如下:

定义 5.6.3 (最优控制问题) 设动态系统由(T,Ω,U,f,x0)组成,动态系统的最优控制问题是指求解(3)maxuUTJ[x,u,tf,xf],s.t.x˙(t)=f(t,x,u), x(t0)=x0, tT

5.6.2 Pontryagin极大值原理

在分析最优控制问题的一阶必要条件前,我们首先给出全变分公式:

引理 5.6.4 (全变分公式) 终端状态xf=x(tf)的变分为(4)δxf=x˙(tf)δtf+δx(tf)

证明 利用定义可得(5)δxf=ddε[(x+εδx)(tf+εδtf)]ε=0=limε0(x+εδx)(tf+εδtf)x(tf)ε=limε0x(tf+εδtf)x(tf)ε+limε0δx(tf+εδtf)=x˙(tf)δtf+δx(tf)

全变分公式的本质为:终端状态的改变δxf同时依赖于状态本身的改变δx(tf)取值时刻的改变δtf,所以当tf变化时,xf会多出一项由时间平移导致的变化。

最优控制问题的一阶必要条件由Pontryagin极大值原理给出:

定理 5.6.5 (一阶必要条件·Pontryagin极大值原理) (x,u,tf,xf)为动态系统的(局部)最优解,定义系统的Hamilton函数为(6)H(t,x,u,p):=L(t,x,u)+p(t)f(t,x,u) 其中p:RRn为伴随变量,则存在p使得

1.

状态方程:(7)x˙(t)T=Hp(t,x,u,p)=f(t,x,u)T,tT

2.

伴随方程:(8)p˙(t)T=Hx(t,x,u,p)=Lx(t,x,u)p(t)Tfx(t,x,u),tT

3.

驻点条件(最大值条件):(9)H(t,x,u,p)H(t,x,u,p),uU, tT U为开集且H关于u可微,则驻点条件可推出(10)Hu(t,x,u,p)=0,tT

4.

终端条件(横截性条件)·时间部分:取决于终端时间tf是否自由,具体如下:

  • tf固定为tf,则无需补充对应的终端条件。
  • tf自由,则终端时间tf应当满足(11)Φt(tf,xf)+H(tf,x,u,p)=0 tf完全自由意味着Φ不显含tf,因此上式化简为H(tf,x,u,p)=0
  • tf半自由,满足不等式约束tftm,则需补充关于tf的互补松弛条件(12)Φt(tf,xf)+H(tf,x,u,p)0,[Φt(tf,xf)+H(tf,x,u,p)](tmtf)=0
5.

终端条件(横截性条件)·状态部分:取决于终端状态xf是否自由,具体如下:

  • xfi固定为xfi,则无需补充对应的终端条件。
  • xfi自由,则终端状态xfi应当满足(13)pi(tf)=Φxi(tf,xf) xfi完全自由意味着Φ不显含xfi,因此上式化简为pi(tf)=0
  • xfi半自由,满足不等式约束xfic,则需补充关于xfi的互补松弛条件(14)pi(tf)Φxi(tf,xf),[pi(tf)Φxi(tf,xf)](xfic)=0

证明 考虑引入系统状态方程和伴随变量的增广泛函:(15)Ja[x,u,p,tf,xf]=Φ(tf,xf)+t0tf[L(t,x,u)+p(t)(f(t,x,u)x˙(t))]dt 则应当有(16)δJa[x,u,p,tf,xf;δx,δu,δp,δtf,δxf]0,p, δx, δu, δp, δtf, δxf 计算Ja的变分可得(17)δJa=Φx(tf,xf)δxf+[Φt(tf,xf)+L(tf,x,u)+p(tf)T(f(tf,x,u)x˙(tf))]δtf +t0tf[Lxδx+Luδu+pT(fxδx+fuδuδx˙)+δpT(fx˙)]dt 其中x的变分δx满足初始条件δx(t0)=δx0=0。将Hamilton函数的表达式代入上式可得(18)δJa=Φx(tf,xf)δxf+[Φt(tf,xf)+H(tf,x,u,p)]δtf[p(tf)Tx˙(tf)δtf+t0tfpTδx˙dt] +t0tf[Hxδx+(Hpx˙T)δp+Huδu]dt 利用分部积分法消去δx˙,结合全变分公式可得(19) p(tf)Tx˙(tf)δtf+t0tfpTδx˙dt=p(tf)Tx˙(tf)δtf+pTδx|t=t0tft0tfp˙Tδxdt=p(tf)T[x˙(tf)δtf+δx(tf)]t0tfp˙Tδxdt=p(tf)Tδxft0tfp˙Tδxdt 将上式代入δJa的表达式中可得(20)δJa=[Φx(tf,xf)p(tf)T]终端条件·状态δxf+[Φt(tf,xf)+H(tf,x,u,p)]终端条件·时间δtf +t0tf[(Hx+p˙T)伴随方程δx+(Hpx˙T)状态方程δp+Hu驻点条件δu]dt0

(1) 下面讨论状态条件和伴随条件。p:RRn,取足够小的ε>0,令(21)δx=ε(Hx+p˙T)T,δp=ε(Hpx˙T)T,δu=0,δxf=0,δtf=0 代入Ja的表达式中可得(22)δJa=εt0tfHx+p˙T2dt+εt0tfHpx˙T2dt0 由此得到状态条件和伴随条件的表达式均为零。

(2) 下面讨论驻点条件(最大值条件)。若uU的内点(意味着δu可取任意值)且H关于u可微,同理可取δu为足够小的正数ε乘驻点条件的表达式、取其余变分为0,可得驻点条件的表达式为零。

uU的边界点,则增广泛函可改写为(23)Ja=Φ(tf,xf)t0tfp(t)Tx˙(t)dt+t0tfH(t,x,u,p)dt uUTτT,取足够小的δ>0,令(24)u~(t)={u(t),tT[τδ,τ+δ]u(t),tT[τδ,τ+δ] 代入x=xp=p、分别代入u~,uJa的表达式中,由于(x(t),u(t))Ja的最优解,故有(25)Ja[u~]Ja[u]=τδτ+δ[H(t,x,u,p)H(t,x,u,p)]dt0 由积分中值定理可得τ~[τδ,τ+δ]使得(26)H(τ~,x,u,p)H(τ~,x,u,p)0δ0+可得(27)H(τ,x,u,p)H(τ,x,u,p)0,uU, τT 因此uH(t,x,u,p)U上的最大值点,称为最大值条件。显然,若U为开集且H关于u可微,则最大值条件可推出驻点条件。

(3) 下面讨论终端条件的时间部分。

  • tf固定,则δtf=0,对应的终端条件无需补充。
  • tf自由,则δtf可取正负,类似可取特定的δtf得到终端条件·时间的表达式均为零,即(28)Φt(tf,xf)+H(tf,x,u,p)=0
  • tf满足不等式约束tftm,分两种情况讨论:

    • 不起作用约束:若tf<tm,则δtf可取正负,此时的终端条件与自由终端时间相同。
    • 起作用约束:若tf=tm,则δtf0,故有Φt(tf,xf)+H(tf,x,u,p)0

    综上所述,需补充关于tf的不等式约束的互补松弛条件:(29)Φt(tf,xf)+H(tf,x,u,p)0,[Φt(tf,xf)+H(tf,x,u,p)](tmtf)=0

(4) 下面讨论终端条件的状态部分。

  • xfi固定,则δxfi=0,对应的终端条件无需补充。
  • xfi自由,则δxfi可取正负,类似可取特定的δxfi得到终端条件·状态的表达式均为零,即(30)pi(tf)=Φxi(tf,xf)
  • xfi满足不等式约束xfic,令δxfi以外的所有变分均为0,则有(31)δJa=[pi(tf)Φxi(tf,xf)]δxfi0 分两种情况讨论:

    • 不起作用约束:若xfi>c,则δxfi可取正负,故pi(tf)=Φxi(tf,xf)
    • 起作用约束:若xfi=c,则δxfi0,故pi(tf)Φxi(tf,xf)

    综上所述,需补充不等式约束的互补松弛条件:(32)pi(tf)Φxi(tf,xf),[pi(tf)Φxi(tf,xf)](xfic)=0

(1)

最大值条件仅在U为开集时才能转换为驻点条件。若U不为开集,则最大值可能在U的边界处取得,此时需要利用最大值条件的原始定义。

(2)

在实际问题中,动态系统的目标泛函通常以下面的形式出现:(33)J[x,u,tf]=Φ(tf,xf)+t0tfert(t,x,u)dt 其中r>0为折现率,此时Hamilton函数可写为(34)H(t,x,u,p)=ert(t,x,u)+p(t)f(t,x,u)=ert[(t,x,u)+λ(t)f(t,x,u)]=:ertHc(t,x,u,λ),λ(t):=ertp(t) 其中λ,Hc称为无折现(当前)伴随变量(影子价格)、Hamilton函数,此时伴随方程为(35)ert[λ˙(t)rλ(t)]=p˙T(t)=Hx(t,x,u,p)=ertHcx(t,x,u,λ) 故关于λ的伴随方程可表示为(36)λ˙(t)Trλ(t)T=Hcx(t,x,u,λ)

5.6.3 Mangasarian充分条件

若Hamilton函数H关于(x,u)严格凹,则驻点条件也是充分条件,即驻点即为最大值点。

定理 5.6.6 (一阶充分条件·Mangasarian条件) (x,u,p,tf,xf)满足Pontryagin极大值原理中的状态方程、伴随方程、驻点条件和终端条件,tf的可行区间为Tftf,且动态系统满足:

  • t[t0,supTf],Hamilton函数H(t,x,u,p)关于联合变量(x,u)凹。
  • 终端状态xf固定为xf,或tTf,终端成本函数Φ(t,x)关于x凹。
  • 终端时间tf固定为tf,或Φt(t,xf)+H(t,x,u,p)关于tTf单调不增。

(x,u,tf,xf)为动态系统的最优解。

证明 (1) 首先固定xf,tf,增广泛函可改写为(37)Ja=Φ(tf,xf)+t0tf[H(t,x,u,p)p(t)Tx˙(t)]dt=Φ(tf,xf)p(tf)Txf+t0tf[H(t,x,u,p)+p˙(t)Tx(t)]dt 代入伴随方程可得(38)Ja=Φ(tf,xf)p(tf)Txf+t0tf[H(t,x,u,p)Hx(t,x,u,p)x(t)]dt 由于H关于(x,u)凹,故成立(39)H(t,x,u,p)H(t,x,u,p)+Hx(t,x,u,p)(x(t)x(t))+λ(u(t)u(t)) 其中λH(x,u)处关于u的某个次梯度。由次梯度的定义和最大值条件可得(40)uUT:{H(t,x,u,p)H(t,x,u,p)H(t,x,u,p)H(t,x,u,p)+λ(u(t)u(t))λ=0 故可选择λ=0,此时(41)H(t,x,u,p)Hx(t,x,u,p)x(t)H(t,x,u,p)Hx(t,x,u,p)x(t) 代入泛函表达式中可得JaJa,其中Ja(x,u)处的目标泛函值,故(x,u)为动态系统的最优解。

(2) 若xf自由,则成立终端条件(42)p(tf)=Φx(tf,xf) 由于Φ关于x凹,故成立(43)Φ(tf,xf)Φ(tf,xf)+Φx(tf,xf)(xfxf)=Φ(tf,xf)+p(tf)T(xfxf) 亦即(44)Φ(tf,xf)p(tf)TxfΦ(tf,xf)p(tf)Txf 与(1)中的不等式一起代入泛函表达式中可得JaJa

(3) 若tf自由,则成立终端条件(45)Φt(tf,xf)+H(tf,x,u,p)=0Ja(x,u,xf)=(x,u,xf)处对tf求导可得(46)dJadtf=Φt(tf,xf)+H(tf,x,u,p) 由于dJadtf关于tf单调不增,故dJadtf[t0,tf]上非负、在[tf,supTf]上非正,因此Jatf处取得最大值,亦即JaJa

5.6.4 包络定理

我们首先给出价值函数的定义。

定义 5.6.7 (价值函数) 动态系统的价值函数定义为:(47)V[t0,x0,tf,xf]:=maxuUTJ[x,u,tf,xf],s.t.x˙(t)=f(t,x,u), x(t0)=x0, tT 即动态系统在给定初始时间t0、初始状态x0、终端时间tf和终端状态xf下的最优目标泛函值。

只有终端时间tf和终端状态xf固定时,价值函数才与其相关,否则价值函数不依赖于其对应的变量。

t0,x0,tf,xf视作动态系统的参数,则动态系统的包络定理为:

定理 5.6.8 (包络定理) (x,u,p)为动态系统的最优解及其对应的伴随变量,则价值函数对初始时间t0、初始状态x0的偏导数分别为(48)Vt0=H(t0,x,u,p),Vx0=p(t0)T 如果终端时间tf和终端状态xf固定,则价值函数对终端时间tf、终端状态xf的偏导数分别为(49)Vtf=Φt(tf,xf)+H(tf,x,u,p),Vxf=Φx(tf,xf)p(tf)T

证明 由价值函数的定义可得(50)V=Ja[x,u,tf,xf]=Φ(tf,xf)+t0tf[L(t,x,u)+p(t)T(f(t,x,u)x˙(t))]dt=Φ(tf,xf)+t0tf[H(t,x,u,p)p(t)Tx˙(t)]dt 令上式分别对x0,t0,xf,tf求变分可得(51)δV=[Φt(tf,xf)+H(tf,x,u,p)p(tf)Tx˙(tf)]δtf+Φx(tf,xf)δxf [H(t0,x,u,p)p(t0)Tx˙(t0)]δt0 +t0tf[Hxδx+Huδu+(fx˙)TδppTδx˙]dt 注意到(52)t0tf[HxδxpTδx˙]dt=t0tf[p˙Tδx+pTδx˙]dt=[pTδx]t=t0tf 将状态方程、伴随方程、驻点条件、上式代入δV的表达式中可得(53)δV=[Φt(tf,xf)+H(tf,x,u,p)p(tf)Tx˙(tf)]δtf+Φx(tf,xf)δxf [H(t0,x,u,p)p(t0)Tx˙(t0)]δt0p(tf)Tδx(tf)+p(t0)Tδx(t0) 在端点t0,tf处,利用全变分公式可得(54)δx(tf)=δxfx˙(tf)δtf,δx(t0)=δx0x˙(t0)δt0 代入δV的表达式中可得(55)δV=[Φt(tf,xf)+H(tf,x,u,p)]δtf+[Φx(tf,xf)p(tf)T]δxf H(t0,x,u,p)δt0+p(t0)Tδx0 由此可得价值函数对初始状态、初始时间、终端状态、终端时间的偏导数表达式。

5.6.5 无界最优控制问题

最后我们讨论无界区间上的动态系统最优控制问题(简称无界最优控制问题)。

定义 5.6.9 (无界区间上的动态系统最优控制问题) 设动态系统由(T,Ω,U,f,x0)组成,目标泛函为(56)J[x,u]:=Φ(x(+))+t0+L(t,x,u)dt 其中x,u应使得上式收敛。无界区间上的动态系统最优控制问题定义如下:(57)maxuUTJ[x,u],s.t.x˙(t)=f(t,x,u), x(t0)=x0, tT

与有界区间相比,我们还需要关注广义积分的收敛性,在实际应用中通常以两种形式呈现:

为了求解无界最优控制问题,我们可以将其视作固定tftf+的极限,计算增广泛函的变分可得(58)δJa=limtf+{[Φx(x(tf))p(tf)T]δx(tf) +t0tf[(Hx+p˙T)δx+(Hpx˙T)δp+Huδu]dt}0 由此可得:

定理 5.6.10 (无界最优控制问题的Pontryagin极大值原理) 无界最优控制问题的状态方程、伴随方程和驻点条件与有界最优控制问题相同,而终端条件为(59)lim supt+[Φx(x(t))p(t)T]δx(t)0 对所有可行的δx成立。

无界最优控制问题的终端条件不能简单地视作有界最优控制问题在tf+的极限,亦即(60)p(+)=Φx(x(+)) 并不总是成立8。同样地,limt+p(t)Tx(t)=0也并不总是成立。读者在应用时请务必小心。

对于无界最优控制问题的一阶充分条件,Mangasarian条件也需要作相应调整:

定理 5.6.11 (无界最优控制问题的一阶充分条件) (x,u,p)满足无界最优控制问题的Pontryagin极大值原理中的状态方程、伴随方程和驻点条件,且动态系统满足:

(a)

tT,Hamilton函数H(t,x,u,p)关于联合变量(x,u)凹。

(b)

对所有可行的x,成立(61)lim supt+[Φ(x(t))Φ(x(t))p(t)T(x(t)x(t))]0

(x,u)为动态系统的最优解。

证明 与Mangasarian条件的证明类似,只需利用(62)Ja=limtf+Φ(x(tf))+t0+[H(t,x,u,p)p(t)Tx˙(t)]dt=limt+[Φ(x(t))p(t)Tx(t)]+t0+[H(t,x,u,p)Hx(t,x,u,p)x(t)]dt 用(b)去控制第一项,用(a)去控制第二项,即可得到JaJa

然而,上述条件(b)通常难以验证,因为需要检查所有可行的x。若动态系统满足一定条件,则可以得到更易验证的充分条件:

定理 5.6.12 (无界最优控制问题的一阶充分条件·续) 若动态系统的所有可行状态x均满足lim inft+x(t)c(表示逐元素大于等于),且

(a)

xΩΦ(x)lim inft+Φ(x(t))

(b)

p有界,且tT使得ttp(t)0

(c)

lim inft+p(t)T(cx(t))0

则对所有可行的x,成立(63)lim supt+[Φ(x(t))Φ(x(t))p(t)T(x(t)x(t))]0

证明 只需利用(64) lim supt+[Φ(x(t))Φ(x(t))p(t)T(x(t)x(t))]lim supt+[Φ(x(t))Φ(x(t))]with (a), 0lim inft+p(t)T(x(t)c)with (b), 0lim inft+p(t)T(cx(t))with (c), 00 上式中第二个大括号0需要用到p有界的条件,否则不能保证函数乘积的下极限仍然非负。

5.6.6 最优控制的应用

我们来看几个例题。

例 5.6.13 已知某动态系统的最优控制问题:(65)maxuRT020e0.25t(4xu2)dts.t.x˙=0.25x+u, x(0)=x0, tT=[0,20] 其中终端状态x(20)自由。

(1)

写出Hamilton函数、状态方程、伴随方程、驻点条件和终端条件。

(2)

求出最优状态变量x(t)、最优控制变量u(t)

(3)

(x,λ)满足的微分方程组作相分析。

(1) 设无折现Hamilton函数为(66)Hc(t,x,u,λ)=4xu2+λ(0.25x+u) 则状态方程、伴随方程、驻点条件分别为(67){x˙=0.25x+u, x(0)=x0λ˙0.25λ=(40.25λ)2u+λ=0{x˙=0.25x+0.5λ, x(0)=x0λ˙=0.5λ4 终端条件为(68)λ(20)=0

(2) 由伴随方程和终端条件可以解出λ(69)λ(t)=88e0.5(t20) 代入状态方程中可解得(70)x(t)=(x016+163e10)e0.25t+16163e0.5(t20)

(3) 为了求出稳态解(xs,λs),计算可得(71){0=0.25xs+12λs0=0.5λs4{xs=16λs=8 微分方程组的系数矩阵为(72)A=[0.250.500.5] 由于trA=0.25>0,故该系统不稳定。

例 5.6.14 已知某动态系统的无界最优控制问题:(73)maxuRT0+ert(uu2x2)dt,s.t.x˙=uδx, x(0)=x0, tT=[0,+) 其中r,δ>0

(1)

写出Hamilton函数、状态方程、伴随方程和驻点条件。

(2)

求出稳态解(xs,λs)

(3)

(x,λ)满足的微分方程组作相分析。

(1) 设无折现Hamilton函数为(74)Hc(t,x,u,λ)=uu2x2+λ(uδx) 则状态方程、伴随方程、驻点条件分别为(75){x˙=uδx, x(0)=x0λ˙rλ=(2xδλ)12u+λ=0{x˙=δx+12λ+12, x(0)=x0λ˙=2x+(r+δ)λ

(2) 为了求出稳态解(xs,λs),计算可得(76){0=δxs+12λs+120=2xs+(r+δ)λs{xs=r+δ2(1+δr+δ2)λs=11+δr+δ2

(3) 微分方程组的系数矩阵为(77)A=[δ122r+δ] 由于detA=δ2δr1<0,故该系统的稳态解为鞍点。

例 5.6.15 求解动态系统的最优控制问题:(78)maxu[0,2]T02(2x3u)dts.t.x˙=x+u, x(0)=4, tT=[0,2] 其中终端状态x(2)自由。

设Hamilton函数为(79)H(t,x,u,p)=2x3u+p(x+u) 则状态方程、伴随方程、驻点条件分别为(80){x˙=x+u, x(0)=4p˙=(2+p) 3+p=0{x˙=x+u, x(0)=4p˙=p2 终端条件为(81)p(2)=0 由伴随方程和终端条件可解得(82)p(t)=2e2t2 然而这里需要注意:由于U=[0,2]为闭集,且H关于u为线性函数,故最大值在边界处取得,驻点条件无法使用。为此,我们需要直接利用最大值条件:

综上所述,记t0=2ln52,最优控制变量为(83)u(t)={2,0t<t0任意,t=t00,t0tt<t0时,解得(84)x˙=x+2, x(0)=4x(t)=6et2x(t0)=125e22t>t0时,解得(85)x˙=x, x(t0)=125e22x(t)=(125e22)ett0=(65e2)et 综上所述,最优状态变量为(86)x(t)={6et2,0t<t0(65e2)et,t0t2

例 5.6.16 求解动态系统的最优控制问题:(87)maxu[0,1]T0T(1u)x2dts.t.x˙=ux, x(0)=1, tT=[0,T], T>12 其中终端状态x(T)自由。

设Hamilton函数为(88)H(t,x,u,p)=(1u)x2+pux 则状态方程、伴随方程、驻点条件分别为(89){x˙=ux, x(0)=1p˙=[2(1u)x+pu]x2+px=0 终端条件为(90)p(T)=0 然而这里需要注意:由于U=[0,1]为闭集,且H关于u为线性函数,故最大值在边界处取得,驻点条件无法使用。为此,我们需要直接利用最大值条件:

由于初始条件x(0)=1>0、终端条件p(T)=0,结合微分方程可知p0:=p(0)0x(t),p(t)均非负,且x单调不减、p单调不增。故存在t0(0,T)使得p(t0)=x(t0),因此(91){p(t)>x(t),u(t)=1,0t<t0p(t)=x(t),u(t)[0,1],t=t0p(t)<x(t),u(t)=0,t0<tT 故以t=t0为界,状态方程和伴随方程可分段表示为(92)t<t0:{x˙=x, x(0)=1p˙=p, p(0)=p0t>t0:{x˙=0p˙=2xt<t0时,解得(93)x(t)=et,p(t)=p0etx(t0)=p(t0)可得(94)t0=12lnp0x(t0)=p(t0)=p0t>t0时,解得(95)x(t)=p0,p(t)=p0+2p0(t0t) 代入终端条件可得(96)p(T)=p0+2p0(t0T)=0t0=T12p0=e2T1 综上所述,最优状态变量为(97)x(t)={et,0t<T12eT12,T12tT

7请读者注意:下文中的x既可能表示Ω中的向量,也可能表示TΩ的函数,但通常不易混淆。

8Halkin, H. (1974). Necessary conditions for optimal control problems with infinite horizons. Econometrica, 42.