摘要
本发明提供了一种基于多智能体深度强化学习的无人机集群智能机会路由方法,旨在优化无人机集群中的数据传输路径,提升通信效率。该方法首先建立了无人机集群的通信信道模型和运动模型,构建分布式部分观测马尔可夫决策过程模型。基于该模型,采用多智能体近端策略优化强化学习算法进行路由决策训练,训练完成后,将智能体的协同策略加载到无人机机载计算机中,实现智能机会路由。在训练过程中,无人机通过不断收集邻居信息并进行局部决策,选择合适的下一跳节点以优化数据转发。通过该方法,无人机集群能够在复杂环境中动态适应,显著提高网络的端到端传输效率和数据包的成功传输率。
技术关键词
多智能体深度强化学习
强化学习算法
智能无人机
机载计算机
神经网络参数
节点
冗余度
决策
通信信道
无人机集群网络
障碍物
邻居
指挥控制中心
路径损耗模型
指挥无人机
强化学习策略
系统为您推荐了相关专利信息
优化调控方法
互补系统
状态空间模型
滚动时域优化
分层
废水循环系统
无人机氢燃料电池
学习控制系统
空压机
喷雾喷嘴
系统发育树
大语言模型
推断方法
嵌入特征
节点特征
联合优化方法
动态
无人机
融合历史数据
长短期记忆网络
分布式状态估计方法
估计误差
状态空间模型
强化学习策略
变量