5.5 动态优化
5.5.1 变分法
在静态优化问题中,我们研究的是目标函数在可行域中的最值问题,其中自变量是可行域中的点。在动态优化问题中,我们研究的仍然是最值问题,但是自变量不再是点、而是函数,亦即在某个函数空间中找到使得目标“函数”取最大值的函数。这种将函数映射为实数的映射称为泛函,动态优化问题也称为泛函优化问题。
定义 5.5.1 (泛函)
设,为某个函数空间,称映射为泛函。
为了将函数映射为实数,泛函通常以积分的形式呈现。我们首先给出最常见的动态优化问题的定义:
定义 5.5.2 (动态优化)
动态优化问题是指求解
其中
为目标泛函,为边界条件。
解决该类问题的基本方法是变分法,其核心思想是:假设为最优解,考虑在附近的函数,其中为足够小的正数,为任意满足边界条件的扰动函数,即
对于本例而言,实际上有。考虑扰动后的目标泛函
对求导可得
为了消除,我们对上式中的第二项进行分部积分,结合边界条件可得
代入原式可得
令可得
由于为最优解,故在处取得极大值,亦即在处取得极大值,由此可得
结合的任意性,可得著名的Euler-Lagrange方程,即动态优化问题的一阶必要条件:
定理 5.5.3 (Euler-Lagrange方程)
设为动态优化问题的最优解,则满足Euler-Lagrange方程
为了更好地应用变分法,我们引入变分的概念,即满足边界条件的函数值的微小变化(扰动函数),定义为
定义 5.5.4 (变分)
设函数均满足某边界条件,称为的变分。
在上例中,即为的变分,满足。类似微分
泛函的变分定义为
定义 5.5.5
设为泛函,的变分为,称
为的变分。在不引起歧义的情况下,通常可以省略。
对于多元泛函而言,容易证明
需要特别注意的是,和通常视作两个独立的变分。可以证明,变分具有以下性质:
定理 5.5.6 (变分的性质)
-
(1)
-
,其中为常数。
-
(2)
-
,。
-
(3)
-
。
-
(4)
-
,其中。
-
(5)
-
变分与微分可交换,即,由此可得
上式常用于变分法的分部积分中。
-
(6)
-
变分与(定限)积分可交换,即
对于上例中的动态优化问题,我们可以用变分重新推导Euler-Lagrange方程:
当为的极大(小)值时,在的邻域内应成立,其中为满足边界条件的任意变分。不妨设为的极大值点(否则考虑),设,取特殊的可得
因此
我们再介绍两个经典的例子。
例 5.5.7 (两点之间线段最短)
设平面上两点,求连接的线段中长度最短的曲线。
解
设曲线方程为,则曲线长度为
由Euler-Lagrange方程可得
故,其中为常数。解得,其中为常数,故最短曲线为直线段。
例 5.5.8 (最速降线)
设平面上两点,求连接的曲线,使得质点在重力作用下沿该曲线从到所需时间最短。
解
设曲线方程为,则质点在曲线上的速度为
故质点从到所需时间为
由于不显含,由Euler-Lagrange方程可得
故有
其中为常数,解得
作变量代换,则有
其中为常数。取正号并结合边界条件可得
上式即为最速降线的参数方程,其为摆线的一部分。
5.5.2 动态系统
动态系统的最优控制问题是指在动态系统的约束下,求解某个目标泛函的最优值。我们首先给出动态系统的定义:
定义 5.5.9 (动态系统)
设,,随时间演化的(一阶)动态系统由以下部分组成:
-
1.
-
时间。
-
2.
-
状态空间非空、状态变量以及初始状态。
-
3.
-
控制空间非空、控制变量。
-
4.
-
由当前状态和控制变量决定的(一阶)状态方程
其中称为系统的动力学函数,满足均连续。
控制变量的含义是每个时刻能施加到系统上的可控量(油门、推力、转矩、舵角、施加电压、消费率……)。动态系统的目标泛函通常不仅与系统演化的过程与控制变量有关,还与系统的终端状态有关,形式为:
定义 5.5.10 (目标泛函)
设动态系统由组成,定义其目标泛函为
其中为运行成本函数,为终端成本函数,满足及其对的一阶偏导数均连续。
动态系统的目标是通过调节控制变量,使得系统状态沿着某条最优轨迹演化,从而使得某个目标泛函取得最优值。动态系统的最优控制问题定义如下:
定义 5.5.11 (最优控制问题)
设动态系统由组成,动态系统的最优控制问题是指求解
最优控制问题的一阶必要条件由Pontryagin极大值原理给出:
定理 5.5.12 (一阶必要条件·Pontryagin极大值原理)
设为动态系统的最优解,定义系统的Hamilton函数为
其中为伴随变量,则存在伴随变量,使得,成立
-
1.
-
状态方程:
-
2.
-
伴随方程:
-
3.
-
驻点条件(极大值条件):
若为开集且关于可微,则驻点条件可推出
-
4.
-
终端条件(横截性条件):取决于终端时间和终端状态是否自由,具体如下:
- 若自由,则需补充
完全自由意味着不显含,因此上式化简为。
- 若自由,则需补充
完全自由意味着不显含,因此上式化简为。
- 若满足不等式约束,则需补充互补松弛条件
- 若固定或满足等式约束(即固定),则无需补充对应的终端条件。
证明
考虑引入系统状态方程和伴随变量的增广泛函:
则应当有
首先固定、认为自由,计算的变分可得
其中的变分满足初始条件。利用分部积分法消去可得
代入泛函的变分表达式中可得终端条件伴随方程驻点条件状态方程
,取分别为正数乘以对应条件的表达式,可得各条件的表达式均为零,即
由于驻点条件并不能保证为最大值点,故需要进一步验证。严谨证明比较啰嗦,故仅在此叙述大致思路,详细证明参见附证。将增广泛函改写为Hamilton函数的形式,利用反证法:假设使得并非最大值点,则可构造一个新的控制变量,使得在处Hamilton函数取得更大值,从而使得增广泛函取得更大值,与最优解的假设矛盾。
若满足等式约束(即固定),则,对应的终端条件无需补充。
若满足不等式约束,令以外的所有变分均为,则有
分两种情况讨论:
- 不起作用约束:若,则可取正负,故。
- 起作用约束:若,则,故。
综上所述,需补充互补松弛条件:
若自由,令为处目标泛函的极大值,则有
由此得到关于的一元函数,求导可得
利用终端条件可将上式化简为
由于为极大值点,故,由此可得自由终端时间的横截性条件。
附证(极大值条件)
增广泛函可改写为
代入、,分别代入,由于为动态系统的最优解,故有
采用反证法:假设、使得
由于、均关于其自变量连续,故存在足够小的正数,使得
令
则
矛盾!因此为最大值点。
注
若令,则动态系统的最优控制问题可退化为动态优化问题,从而Pontryagin极大值原理退化为Euler-Lagrange方程。
以上定理给出最优控制问题的一阶必要条件。若Hamilton函数关于控制变量严格凹,则驻点条件也是充分条件,即驻点即为最大值点。
定理 5.5.13 (一阶充分条件)
设满足Pontryagin极大值原理中的状态方程、伴随方程、驻点条件和终端条件,且动态系统满足:
- 终端时间固定。
- Hamilton函数关于联合变量凹。
- 终端成本函数关于凹。
则为动态系统的最优解。
证明
泛函可改写为
代入伴随方程、终端条件可得
由于关于凹,关于凹,故成立
代入驻点条件,变形可得
代入泛函表达式中可得,其中为处的目标泛函值,故为动态系统的最优解。
注
若终端时间不固定,可通过重参数化将问题转化为固定终端时间的问题,从而应用上述充分条件。