摘要
本发明公开了一种基于分布式强化学习的无人机集群智能编队方法、装置及设备,包括:根据无人机的飞行任务场景构建包括状态空间、动作空间以及奖励函数的无人机集群的强化学习环境,飞行任务场景包括执行空中加油、长距离编队运输;基于所述强化学习环境搭建分布式强化学习算法的训练框架,并基于所述训练框架进行网络构建,得到包括动作决策网络和编队目标评估网络的神经网络;通过调整所述神经网络的超参数以及利用大规模分布式数据对所述神经网络进行分布式训练,得到编队模型;将所述编队模型加载至实际的无人机集群系统中,根据实时的飞行环境和任务需求调整编队策略进行编队飞行任务。能够提高无人机集群的协同飞行能力和自适应性。
技术关键词
分布式强化学习
强化学习环境
编队方法
无人机集群系统
网络
分布式训练
决策
采样模块
参数
异步方式
样本
全局状态信息
存储模块
环境感知信息
框架
场景
节点
策略
系统为您推荐了相关专利信息
图像去雾方法
Sigmoid函数
图像去雾模型
小波变换处理
去雾图像
精英遗传算法
大坝
参数学习方法
深度学习模型训练
交互特征
夹持输送装置
结球类蔬菜收获机
PID控制算法
卷积神经网络模型
调节夹持装置
预测网络模型
延展方法
功率谱密度估计
神经网络模型
编码器