导弹的轨迹优化实际上是求解在微分-代数方程、等式及不等式约束条件下的泛函的极值, 其数值解法主要有间接法和直接法[12]。
间接法基于 Pontryagin 极小值原理和变分法将最优控制问题转换成 Hamiltonian 两点边 值(HBVP)问题[13]。其解算过程是先基于 Hamiltonian 函数最小求得最优控制变量的表达式, 再由正则方程、边界条件、横截条件和最优终端时刻条件求解状态变量及终端时刻[14]。间接 法不仅满足一阶必要条件,还能够获得控制变量和协态变量的精确解。针对间接法,李向前 等以极大值原理和变分法为理论基础,采用牛顿迭代法求得协态变量的初值和导弹飞行时间, 研究了某一战术近程导弹主动段攻角优化问题[15];吴嘉梁等针对固体火箭上升段问题,以推 力方向为控制量,能量最小为性能指标,由极小值原理得到最优化的一阶必要条件,并以真 空条件下的最优轨迹为初始值,以状态响应方程构造迭代方法,求得真实大气的火箭最优轨 迹[16]。但是由于保证 HBVP 问题收敛的协态变量没有物理意义,其初值很难估计,同时还存在 收敛半径小,对初值敏感等问题,HBVP 的求解是非常困难的。77979
直接法不要需求解一阶必要条件,直接参数化状态量和(或)控制量,将原始的连续时 间最优控制问题转化为离散时间点上的非线性规划问题(NLP),通过数值方法寻找最优解。 直接法较间接法更为广泛地应用于轨迹优化问题,离散化的方法多种多样,主要有直接打靶 法、多重直接打靶法、配点法、微分包含法、群智能算法等 [17]。
1)直接打靶法。 直接打靶法只离散控制量,通过数值积分获得状态量及终端时刻,求得目标函数和等式
及不等式约束,且能够用较少的优化参数获得高精度的解。王方鹏等利用打靶法将控制变量 攻角在空域上参数化,将连续时间的最优控制问题参数化[18];王华、唐国金等针对有限推 力最优交会问题,选取推力方向为控制变量,由离散的控制量积分得到状态量,由节点上的 控制和状态约束构成代数形式的等式和不等式约束,并从插值和数值积分两个方面对转换过 程中产生的误差进行了深入分析[19]。但当离散点数目增加时,NLP 规模急剧增大,运算量过 大,需要很长时间才能求得满足要求的解。同时,目前难以证明所得的解收敛于控制系统。论文网
2)多重直接打靶法。
直接打靶法对单区间 , 进行数值积分运算,但当区间间隔较大时,将无法满足精度 要求,得不到理想解。多重直接打靶法在直接打靶法基础上对其进行了改进,对单区间 ,
分段处理,在所有的配点对控制变量离散化,同时,将状态变量在所选的节点处离散,数值 积分运算每次运行到选中的节点时都重新开始积分,这不仅保证了节点处的状态量为精确值, 还提高计算精度。文献[20]针对美国的航天飞机轨道器的再入轨迹展开了弹道优化方面的研 究,在不同约束条件和目标函数下采用多重直接打靶法将最优控制问题参数化,并将几种优 化结果与航天飞机的实际再入轨迹对比,得到最符合实际飞行的方案;文献[21]研究了一种 简化的多重直接打靶算法,并将其应用到气垫船最短时间轨迹优化问题和飞船举力轨迹优化 问题上;仿真结果表明该算法较直接打靶法对初始值敏感度小,能够快速收敛于理想解。 3)配置法。论文网
配置法在时间域上同时离散控制量和状态量,把连续时间的最优控制问题转化为配置点 处的非线性规划问题,包括 PM、Hermit-Simpson、Runge-Kutta 法以及欧拉法[13]。由于状态 变量离散值的大小未知,积分的过程不能直接用数值表示,而是符号之间的运算,故通过数 值计算程序无法解算,这导致早期的配置法无法广泛应用于轨迹优化,直到 MatLab 等基于符 号运算和数值分析的软件的出现,配置法的应用才更加广泛。与打靶法相比,配置法转化的 NLP 的变量数更多, 提高了收敛的快速性和计算精度。文献[22-23]针对变后掠翼导弹的弹 道优化问题,在考虑了路径约束和终端约束的前提下,采用伪谱法对变后掠翼导弹的后掠角 和攻角进行了双变量优化,寻找符合条件的射程最远弹道。