摘要
本发明所提供的一种无人机集群的目标匹配方法、装置、终端及存储介质,涉及无人机技术领域,该方法包括:构建无人机编队模型,基于深度离线强化学习对无人机编队模型进行训练以推理出最优无人机阵型;在控制无人机集群形成最优无人机阵型时,计算出无人机相对攻击目标的目标优势度和攻击目标对无人机的目标威胁度;根据目标优势度和目标威胁度确定出无人机与攻击目标之间的配对决策值,基于配对决策值构造权值网络;利用网络流算法确定权值网络下无人机匹配攻击目标的最优匹配结果。本发明基于深度离线强化学习的编队模型优化无人机协同作战中的编队策略,基于网络流算法的目标匹配策略实现目标分配的全局最优,实现高效率和高实时性的目标匹配。
技术关键词
无人机集群
无人机编队
构建无人机
出无人机
决策
控制无人机
网络
速度
无人机协同作战
深度确定性策略梯度
离线
算法
导弹
模型训练模块
可读存储介质
方位角
无人机技术
仿真环境