摘要
本申请公开了一种基于态势驱动的超视距空战双环耦合自主机动决策方法、设备、介质及产品,涉及航空航天技术领域,该方法包括:利用训练好的LSTM模型,分别根据敌方目标和本机的状态控制信息,进行递归预测,得到敌方目标和本机的多步航迹预测信息;计算双方的态势变化梯度;将本机航迹信息和敌方目标的状态控制信息输入训练好的第一强化学习模型生成主动作指令;将本机航迹信息、敌方目标的状态控制信息以及双方的态势变化梯度,输入训练好的第二强化学习模型生成预加载动作指令;利用零空间行为法,将主动作指令与预加载动作指令融合,得到自主机动决策指令。本申请可降低信息不完备下的决策风险,实现战机平滑的战术转换。
技术关键词
强化学习模型
决策方法
航迹预测
深度确定性策略梯度
航迹信息
动作指令信息
连续动作空间
LSTM模型
雅可比矩阵
航空航天技术
处理器
计算机程序产品
算法
计算机设备
可读存储介质
存储器
代表