Pontryagin最小值原理(Pontryagin's Minimum Principle,简称PMP)是最优控制理论中的一个基本定理,主要用于求解动态系统的最优控制问题。它为如何通过最小化一个代价函数来求解最优轨迹提供了必要条件。Pontryagin最小值原理在很多领域都有广泛的应用,比如机器人、飞行器控制、经济学等。
Pontryagin最小值原理的背景
最优控制问题的目标是:给定一个控制系统,如何选择控制输入,使得某个代价函数(通常与时间、能量、平滑度等相关)最小化,同时满足系统的动态约束。
问题的基本形式
假设系统的动态模型为:
其中:
- 是系统的状态(如位置、速度等),
- 是控制输入(如推力、加速度等),
- 是系统的动力学函数,描述了状态如何随时间变化,
- 和分别是初始和终止时刻的状态。
我们的目标是最小化代价函数:
其中:
- 是运行代价,通常是与控制输入、状态和时间相关的代价,
- 是终端代价,与终止状态相关。
系统动态方程
Pontryagin最小值原理的核心内容
Pontryagin最小值原理提供了最优控制问题的必要条件,这些条件用于求解最优轨迹和最优控制输入。
关键步骤:引入伴随量(Costate)
- 伴随量(Costate):首先,引入伴随量 ,它是一个与状态变量 相关的辅助变量,用来描述约束的影响。伴随量是拉格朗日乘子法的一个扩展,用来对系统的状态约束进行惩罚。伴随量定义为:
其中 H 是Hamiltonian函数,稍后定义。
- Hamiltonian函数:为了通过最优控制问题的条件来解决问题,定义Hamiltonian函数 H:
- 这里, 是运行代价函数,
- 是伴随量与状态变化率的内积,表示系统的动态约束对优化问题的影响。
Pontryagin最小值原理的条件
- 状态方程(State equation):最优状态轨迹 满足系统的动力学方程:
这是系统的动态约束。
- 伴随方程(Costate equation):伴随量 需要满足以下方程(由Hamiltonian的导数推导而来):
伴随量的变化率由Hamiltonian函数的梯度决定,最终的伴随量值与终端代价的梯度相关。
- 最优控制(Optimal control):最优控制输入是通过最小化Hamiltonian函数 来获得的:
最优控制输入是Hamiltonian函数对控制输入的最小化,通常我们通过对 u 求导并令其为零来得到最优解。
终端条件
- 终端条件 ,表示终止状态的梯度。
Pontryagin最小值原理的实际应用
通过Pontryagin最小值原理,我们可以通过求解以下方程组来得到最优轨迹和最优控制输入:
- 状态方程(描述系统的演化);
- 伴随方程(描述系统状态对最优轨迹的影响);
- 最优控制方程(通过最小化Hamiltonian来得到最优控制输入)。
这些方程组通常是常微分方程(ODEs),并且必须通过数值方法来求解,例如射击法、谱法等。
总结
Pontryagin最小值原理为最优控制问题提供了一个强有力的工具,它通过引入伴随量(Costate)和Hamiltonian函数,将最优控制问题转化为一组常微分方程。这些方程为最优轨迹和最优控制输入提供了必要条件。通过解决这些方程,我们可以获得系统的最优控制策略。
在实际应用中,Pontryagin最小值原理被广泛应用于飞行器、机器人、经济学等领域,尤其是在需要在动力学约束下进行最优轨迹规划的情况下。

