摘要
本发明提出了一种基于态势预测的深度强化学习空战决策方法,属于技术领域,解决了无人机在复杂空战环境中不能实现自主决策和环境自适应的技术问题。技术方案为:通过无人机的运动学和动力学特征建模以适应实际飞行状态;建立深度强化对抗环境进行无人机对抗训练;利用LSTM预测算法动态评估敌方无人机状态,快速获取其下一时刻状态;根据奖励分配作为决策器输入,结合预测状态和奖励结果,推理敌方无人机态势动作,实现跟踪打击。本发明结合机器智能计算优势与人类经验判断,在复杂不确定环境下提高敌方无人机意图识别准确性,增强我方无人机的决策能力和战术优势。
技术关键词
无人机
深度强化学习
决策方法
LSTM模型
预训练模型
强化学习环境
SAC算法
运动学特征
模型算法
意图识别
分段
因子
表达式
动态
数据
参数
轨迹
策略