平流层飞艇在复杂风场扰动和模型不确定性下的高精度轨迹跟踪是一个具有挑战性的问题. 为解决传统控制在不确定环境中抗干扰能力不足的局限, 本文提出了一种将反步滑模控制(backstepping sliding mode control, BSMC)与强化学习(reinforcement learning, RL)相结合的自适应复合控制方法. 首先基于李雅普诺夫稳定性理论设计反步滑模控制律, 为系统提供稳定性保障并实现基础跟踪控制; 同时, 引入RL算法作为智能补偿器, 通过在线学习实时抑制复杂扰动. 创新性地设计了基于跟踪误差S型函数的自适应权重分配机制, 实现了BSMC与RL控制器的平滑切换与协同作用: 当误差较小时, 以BSMC为主, 确保系统稳定性; 当误差较大或干扰较强时, 则激活RL补偿控制器以快速收敛. 仿真结果表明, 与反步法控制(backstepping control, BC)及BSMC相比, 该复合控制器在未知干扰环境下能显著提升跟踪精度, 展现出更优越的鲁棒性和环境适应性.
Meng et al. (Sun,) studied this question.