摘要
本发明提供一种基于深度强化学习的无人机躲避方法,属于控制策略领域。首先,建立无人机的三维运动学模型,作为躲避策略训练学习环境;其次,设定无人机动作集合,保证机动策略的完备性;再次,在无人机‑导弹追逃模型与动作集合基础上设计过程奖励与结果奖励,得到躲避策略奖励函数,引导无人机躲避导弹追击;最后,构造训练学习环境与躲避策略奖励函数后,在导弹采用智能制导策略的情形下进行训练,直至无人机躲避成功,获得高质量躲避策略。本发明能够使无人机掌握结合能量管理与空间机动的复合型规避策略,有效应对高速导弹的拦截威胁,在极限条件下做出迅速且精准的反应,极大提升生存能力。
技术关键词
躲避方法
导弹
深度强化学习
制导策略
引导无人机
无人机飞行高度
能量管理
无人机规避
数值积分方法
无人机模型
飞机
更新网络参数
无人机高度
坐标
速度
方位角
实时信息
基础