摘要
本发明提出了一种基于深度强化学习的无人机集群一致性决策系统及方法,其中,所述系统包括:所述经验回放池,用于存储无人机集群在执行任务过程中产生的观测信息、动作、状态和奖励;所述观测转换模块,将无人机所在的当前环境的观测信息转换为协同观测信息;所述一致性决策调整模块,用于协调不同无人机的决策行为;所述多无人机混合网络,对各个无人机的决策进行联合优化;所述网络优化器,对多无人机混合网络的参数进行优化更新;所述无人机任务仿真平台,用于提供训练和测试环境,模拟无人机集群的实际任务场景,并提供状态反馈给多无人机混合网络和网络优化器;所述方法采用所述系统进行无人机集群一致性决策。
技术关键词
无人机集群
混合网络
仿真平台
决策系统
网络优化器
多无人机
全局状态信息
模拟无人机
决策方法
无人机协同
前馈神经网络
深度强化学习方法
反向传播方法
模块
采集无人机
系统为您推荐了相关专利信息
自动化仓库
路径规划方法
RNN神经网络
障碍物
推理网络
三维虚拟模型
决策系统
数字孪生
重构模块
环境参数采集单元
数据融合算法
数据分析模块
超声波风速传感器
信号处理模块
决策系统