摘要
本发明公开了一种基于HAPPO算法的无人机集群对抗决策优化方法、装置及存储介质,属于飞行器技术领域。方法包括:获取目标点位置信息、红方无人机的位置与状态信息及蓝方无人机的位置与状态信息;将各无人机作为决策者,将目标点位置信息、无人机位置与态势信息作为状态,将无人机航迹点作为动作,基于预设的奖励函数与折扣因子,将预先构建的无人机集群对抗决策优化模型转化为马尔可夫决策过程;各无人机利用预先训练的深度强化神经网络,基于目标点位置信息及红蓝双方无人机的位置与状态信息对马尔可夫决策过程求解,得到无人机集群对抗策略。本发明能够实现多智能体控制下的无人机集群在复杂态势环境下的灵活性调整,以高效地完成作战任务目标。
技术关键词
无人机集群对抗
决策优化方法
深度强化神经网络
策略
算法
多智能体控制
无人机航迹
智能体模型
神经网络参数
因子
飞行器技术
超参数
训练场景
神经网络模型
坐标
障碍物
系统为您推荐了相关专利信息
打桩船
桩基
参数
矩阵
非暂态计算机可读存储介质
空洞
反演模型
空间金字塔池化
地震波阻抗反演
编码模块
实体对齐方法
大语言模型
对齐模块
网络安全知识图谱
训练语言模型