5.2 知识点复习

5.2.1 再谈极值

求函数f:RnRC2的所有极值的一般步骤为:

(1)

求解f=0,得到所有的驻点x1,,xk

(2)

计算Hessian矩阵Hf,对每个驻点xi,依次验证Hf(xi)为正定、负定、不定还是退化(有0特征值)。

(3)

正定xi为极小值点;负定xi为极大值点;不定xi为鞍点。

(4)

对于退化的情况,需要使用其他方法来判断,如近似分析法、更高阶的Taylor展开,或利用下面的定理。

定理 5.2.1 设函数f:RnRC2x0f的驻点。若存在x0的邻域U使得HfU内半正(负)定,则x0f的极小(大)值点。

证明 仅证明半正定的情形。利用带Lagrange余项的Taylor公式,θ(0,1)使得(1)f(x)=f(x0)+12(xx0)THf(x0+θ(xx0))(xx0)f(x0),xUx0为极小值点。

近似分析法是Taylor展开的一种应用,即(2)f(x01+v1,,x0n+vn)=f(x01,,x0n)++o(vk) 它可以用来判断驻点x0的极值性。

如果在驻点x0的任意邻域,都存在使得Hf不是半正定的点,不能推出x0不为极小值点,如一元函数f(x)=x2nsin21x(nN)f(x)=e1x2sin21xC。如果补充条件:fx0处解析,则可以推出x0不为极小值点。

定义 5.2.2 fRRx0处解析,若存在x0的邻域U,使得fU内的Taylor级数收敛于f

5.2.2 再谈条件极值

求函数f:RnR在约束条件g1,,gr:RnRg1=gr=0下的所有条件极值的一般步骤为:

(1)

构造Lagrange函数L(x,λ)=f(x)i=1rλigi(x)

(2)

求解L=0,得到所有的驻点x1,,xk

(3)

计算Hessian矩阵HL,对每个驻点xi,依次限制在约束曲面的切空间Txi(Σ)上验证HL(xi)为正定、负定、不定还是退化(有0特征值)。

(4)

正定xi为极小值点;负定xi为极大值点;不定xi为鞍点。

(5)

对于退化的情况,需要使用其他方法来判断。

求解条件极值的另一种方法是将约束曲面Σ={xRng1(x)==gr(x)=0}参数化,得到x=x(t1,,tnr);随后将fΣ上表示为f(x(t))=F(t1,,tnr),求解F的所有极值。

在特殊情况下可以将约束条件代入目标函数中,使得新的目标函数恰有nr个自变量,从而可以直接使用求极值的方法。

(1)

在题设的约束条件下可能会有隐含的约束条件,如z2=xy+xy+4需要满足xy+xy+40。在求出驻点后,还需要验证这些隐含的约束条件。

(2)

尽管我们需要验证Hessian矩阵在切空间上的性质,但如果Hessian本身是正(负)定的,其约束在切空间上一定是正(负)定的。这给出了一个判断条件极值的简便方法(充分条件)。

5.2.3 隐函数的极值

对于方程F(x1,,xn,y)=0确定的隐函数y=y(x)(需要满足Fy0),为了求出y的所有极值,有时候可以直接解方程求得y的表达式,但通常较为繁琐。

为了规避解方程,可以计算微分(3)Fx1dx1++Fxndxn+Fydy=0 随后代入dy=0得到驻点满足的条件(4)Fx1=Fx2==Fxn=F(x1,,xn,y)=0

求出驻点(x0,y0)后,既可以采用近似分析法来判断yx0附近的走势,亦即(5)0=F(x01+v1,,x0n+vn,y0+u)u=+o(vk) 由此即可判断x0是极大值点、极小值点还是鞍点。这里通常需要以下定理:

定理 5.2.3 (6)f(x)+o(f(x))=Bg(x)+o(g(x)),xx0 (7)f(x)=Bg(x)+o(g(x)),xx0 特别地,若B=1,则我们证明了:fg等价当且仅当gf等价。

也可以采用二阶微分的方法来判断,计算可得1(8)i=1nj=1n2Fxixjdxidxj+2i=1n2Fxiydxidy+2Fy2dy2+Fyd2y=0 代入dy=0可得(9)d2y=(Fy)1i=1nj=1n2Fxixjdxidxj 由此即可判断x0是极大值点、极小值点还是鞍点。

还可以采用条件极值的方法求出y的所有极值,即构造Lagrange函数(10)L(x1,,xn,y,λ)=y+λF(x1,,xn,y)

5.2.4 *最优性条件

主要内容包括凸函数基本概念、无约束极值问题、等式约束极值问题、一般约束极值问题。大家可以参考 王兆臻学长的习题课课件2

1对自变量xi来说有d2xi=0

2./figure/kkt_wzz.pdf