5.6 最优控制
5.6.1 动态系统
动态系统的最优控制问题是指在动态系统的约束下,求解某个目标泛函的最优值。我们首先给出动态系统的定义:
定义 5.6.1 (动态系统)
设,,记,随时间演化的(一阶)动态系统由以下部分组成:
-
1.
-
时间。
-
2.
-
状态空间非空、开,状态变量以及初始状态。
-
3.
-
控制空间非空,控制变量。
-
4.
-
由当前状态和控制变量决定的(一阶)状态方程
其中称为系统的动力学函数,满足均连续。
控制变量的含义是每个时刻能施加到系统上的可控量(油门、推力、转矩、舵角、施加电压、消费率……)。动态系统的目标泛函通常不仅与系统演化的过程与控制变量有关,还与系统的终端状态有关,形式为:
定义 5.6.2 (目标泛函)
设动态系统由组成,定义其目标泛函为
其中为终端时间、为终端状态,为运行成本函数,为终端成本函数,满足以及均连续。
动态系统的目标是通过调节控制变量,使得系统状态沿着某条最优轨迹演化,从而使得某个目标泛函取得最优值。动态系统的最优控制问题定义如下:
定义 5.6.3 (最优控制问题)
设动态系统由组成,动态系统的最优控制问题是指求解
5.6.2 Pontryagin极大值原理
在分析最优控制问题的一阶必要条件前,我们首先给出全变分公式:
引理 5.6.4 (全变分公式)
终端状态的变分为
证明
利用定义可得
注
全变分公式的本质为:终端状态的改变同时依赖于状态本身的改变和取值时刻的改变,所以当变化时,会多出一项由时间平移导致的变化。
最优控制问题的一阶必要条件由Pontryagin极大值原理给出:
定理 5.6.5 (一阶必要条件·Pontryagin极大值原理)
设为动态系统的(局部)最优解,定义系统的Hamilton函数为
其中为伴随变量,则存在使得
-
1.
-
状态方程:
-
2.
-
伴随方程:
-
3.
-
驻点条件(最大值条件):
若为开集且关于可微,则驻点条件可推出
-
4.
-
终端条件(横截性条件)·时间部分:取决于终端时间是否自由,具体如下:
- 若固定为,则无需补充对应的终端条件。
- 若自由,则终端时间应当满足
完全自由意味着不显含,因此上式化简为。
- 若半自由,满足不等式约束,则需补充关于的互补松弛条件
-
5.
-
终端条件(横截性条件)·状态部分:取决于终端状态是否自由,具体如下:
- 若固定为,则无需补充对应的终端条件。
- 若自由,则终端状态应当满足
完全自由意味着不显含,因此上式化简为。
- 若半自由,满足不等式约束,则需补充关于的互补松弛条件
证明
考虑引入系统状态方程和伴随变量的增广泛函:
则应当有
计算的变分可得
其中的变分满足初始条件。将Hamilton函数的表达式代入上式可得
利用分部积分法消去,结合全变分公式可得
将上式代入的表达式中可得终端条件状态终端条件时间伴随方程状态方程驻点条件
(1) 下面讨论状态条件和伴随条件。,取足够小的,令
代入的表达式中可得
由此得到状态条件和伴随条件的表达式均为零。
(2) 下面讨论驻点条件(最大值条件)。若为的内点(意味着可取任意值)且关于可微,同理可取为足够小的正数乘驻点条件的表达式、取其余变分为,可得驻点条件的表达式为零。
若为的边界点,则增广泛函可改写为
、,取足够小的,令
代入、、分别代入到的表达式中,由于为的最优解,故有
由积分中值定理可得使得
令可得
因此为在上的最大值点,称为最大值条件。显然,若为开集且关于可微,则最大值条件可推出驻点条件。
(3) 下面讨论终端条件的时间部分。
- 若固定,则,对应的终端条件无需补充。
- 若自由,则可取正负,类似可取特定的得到终端条件·时间的表达式均为零,即
-
若满足不等式约束,分两种情况讨论:
- 不起作用约束:若,则可取正负,此时的终端条件与自由终端时间相同。
- 起作用约束:若,则,故有。
综上所述,需补充关于的不等式约束的互补松弛条件:
(4) 下面讨论终端条件的状态部分。
- 若固定,则,对应的终端条件无需补充。
- 若自由,则可取正负,类似可取特定的得到终端条件·状态的表达式均为零,即
-
若满足不等式约束,令以外的所有变分均为,则有
分两种情况讨论:
- 不起作用约束:若,则可取正负,故。
- 起作用约束:若,则,故。
综上所述,需补充不等式约束的互补松弛条件:
注
-
(1)
-
最大值条件仅在为开集时才能转换为驻点条件。若不为开集,则最大值可能在的边界处取得,此时需要利用最大值条件的原始定义。
-
(2)
-
在实际问题中,动态系统的目标泛函通常以下面的形式出现:
其中为折现率,此时Hamilton函数可写为
其中称为无折现(当前)伴随变量(影子价格)、Hamilton函数,此时伴随方程为
故关于的伴随方程可表示为
5.6.3 Mangasarian充分条件
若Hamilton函数关于严格凹,则驻点条件也是充分条件,即驻点即为最大值点。
定理 5.6.6 (一阶充分条件·Mangasarian条件)
设满足Pontryagin极大值原理中的状态方程、伴随方程、驻点条件和终端条件,的可行区间为,且动态系统满足:
- ,Hamilton函数关于联合变量凹。
- 终端状态固定为,或,终端成本函数关于凹。
- 终端时间固定为,或关于单调不增。
则为动态系统的最优解。
证明
(1) 首先固定,增广泛函可改写为
代入伴随方程可得
由于关于凹,故成立
其中为在处关于的某个次梯度。由次梯度的定义和最大值条件可得
故可选择,此时
代入泛函表达式中可得,其中为处的目标泛函值,故为动态系统的最优解。
(2) 若自由,则成立终端条件
由于关于凹,故成立
亦即
与(1)中的不等式一起代入泛函表达式中可得。
(3) 若自由,则成立终端条件
令在处对求导可得
由于关于单调不增,故在上非负、在上非正,因此在处取得最大值,亦即。
5.6.4 包络定理
我们首先给出价值函数的定义。
定义 5.6.7 (价值函数)
动态系统的价值函数定义为:
即动态系统在给定初始时间、初始状态、终端时间和终端状态下的最优目标泛函值。
注
只有终端时间和终端状态固定时,价值函数才与其相关,否则价值函数不依赖于其对应的变量。
将视作动态系统的参数,则动态系统的包络定理为:
定理 5.6.8 (包络定理)
设为动态系统的最优解及其对应的伴随变量,则价值函数对初始时间、初始状态的偏导数分别为
如果终端时间和终端状态固定,则价值函数对终端时间、终端状态的偏导数分别为
证明
由价值函数的定义可得
令上式分别对求变分可得
注意到
将状态方程、伴随方程、驻点条件、上式代入的表达式中可得
在端点处,利用全变分公式可得
代入的表达式中可得
由此可得价值函数对初始状态、初始时间、终端状态、终端时间的偏导数表达式。
5.6.5 无界最优控制问题
最后我们讨论无界区间上的动态系统最优控制问题(简称无界最优控制问题)。
定义 5.6.9 (无界区间上的动态系统最优控制问题)
设动态系统由组成,目标泛函为
其中应使得上式收敛。无界区间上的动态系统最优控制问题定义如下:
注
与有界区间相比,我们还需要关注广义积分的收敛性,在实际应用中通常以两种形式呈现:
- 支集有界的运行成本:存在常数,使得,,此时广义积分可化为有限区间上的定积分,自然收敛。
- 折现形式的运行成本:,其中为折现率,只需关于的增长速度不超过(如有界)即可保证广义积分收敛。
为了求解无界最优控制问题,我们可以将其视作固定而的极限,计算增广泛函的变分可得
由此可得:
定理 5.6.10 (无界最优控制问题的Pontryagin极大值原理)
无界最优控制问题的状态方程、伴随方程和驻点条件与有界最优控制问题相同,而终端条件为
对所有可行的成立。
注
无界最优控制问题的终端条件不能简单地视作有界最优控制问题在的极限,亦即
并不总是成立。同样地,也并不总是成立。读者在应用时请务必小心。
对于无界最优控制问题的一阶充分条件,Mangasarian条件也需要作相应调整:
定理 5.6.11 (无界最优控制问题的一阶充分条件)
设满足无界最优控制问题的Pontryagin极大值原理中的状态方程、伴随方程和驻点条件,且动态系统满足:
-
(a)
-
,Hamilton函数关于联合变量凹。
-
(b)
-
对所有可行的,成立
则为动态系统的最优解。
证明
与Mangasarian条件的证明类似,只需利用
用(b)去控制第一项,用(a)去控制第二项,即可得到。
然而,上述条件(b)通常难以验证,因为需要检查所有可行的。若动态系统满足一定条件,则可以得到更易验证的充分条件:
定理 5.6.12 (无界最优控制问题的一阶充分条件·续)
若动态系统的所有可行状态均满足(表示逐元素大于等于),且
-
(a)
-
,。
-
(b)
-
有界,且使得,。
-
(c)
-
。
则对所有可行的,成立
证明
只需利用
上式中第二个大括号需要用到有界的条件,否则不能保证函数乘积的下极限仍然非负。
5.6.6 最优控制的应用
我们来看几个例题。
例 5.6.13
已知某动态系统的最优控制问题:
其中终端状态自由。
-
(1)
-
写出Hamilton函数、状态方程、伴随方程、驻点条件和终端条件。
-
(2)
-
求出最优状态变量、最优控制变量。
-
(3)
-
对满足的微分方程组作相分析。
解
(1) 设无折现Hamilton函数为
则状态方程、伴随方程、驻点条件分别为
终端条件为
(2) 由伴随方程和终端条件可以解出为
代入状态方程中可解得
(3) 为了求出稳态解,计算可得
微分方程组的系数矩阵为
由于,故该系统不稳定。
例 5.6.14
已知某动态系统的无界最优控制问题:
其中。
-
(1)
-
写出Hamilton函数、状态方程、伴随方程和驻点条件。
-
(2)
-
求出稳态解。
-
(3)
-
对满足的微分方程组作相分析。
解
(1) 设无折现Hamilton函数为
则状态方程、伴随方程、驻点条件分别为
(2) 为了求出稳态解,计算可得
(3) 微分方程组的系数矩阵为
由于,故该系统的稳态解为鞍点。
例 5.6.15
求解动态系统的最优控制问题:
其中终端状态自由。
解
设Hamilton函数为
则状态方程、伴随方程、驻点条件分别为
终端条件为
由伴随方程和终端条件可解得
然而这里需要注意:由于为闭集,且关于为线性函数,故最大值在边界处取得,驻点条件无法使用。为此,我们需要直接利用最大值条件:
- 当时,最大值在处取得,此时。
- 当时,最大值在处取得,此时。
- 当时,最大值在上均可取得,此时。
综上所述,记,最优控制变量为任意
当时,解得
当时,解得
综上所述,最优状态变量为
例 5.6.16
求解动态系统的最优控制问题:
其中终端状态自由。
解
设Hamilton函数为
则状态方程、伴随方程、驻点条件分别为
终端条件为
然而这里需要注意:由于为闭集,且关于为线性函数,故最大值在边界处取得,驻点条件无法使用。为此,我们需要直接利用最大值条件:
- 当时,最大值在处取得,此时。
- 当时,最大值在处取得,此时。
- 当时,最大值在上均可取得,此时。
由于初始条件、终端条件,结合微分方程可知、均非负,且单调不减、单调不增。故存在使得,因此
故以为界,状态方程和伴随方程可分段表示为
当时,解得
令可得
当时,解得
代入终端条件可得
综上所述,最优状态变量为