摘要
本发明提出了一种面向多无人机系统的断层路由决策方法,包括以下步骤:步骤1,基于传统多智能体强化学习方法进行改进,增加协同奖励重估机制,得到改进后的多智能体强化学习方法;步骤2,将多无人机系统设为理想化网络环境,对改进后的多智能体强化学习方法进行训练和优化,得到优化后的策略网络;步骤3,设置故障检测周期并根据故障检测结果进行路由决策,完成面向多无人机系统的断层路由决策。本发明能够适应复杂动态环境下的高效数据传输需求,对提升多UAV系统的任务执行能力与应用效能具有关键作用;其中,奖励重估机制,可以提高延迟奖励的传播效率,加快路由决策算法训练收敛速度。
技术关键词
多无人机系统
智能体强化学习方法
多智能体强化学习
决策方法
故障检测
汇聚节点
策略
网络
传输路径
数据传输需求
机制
源节点
时延
邻居
决策算法
周期
系统为您推荐了相关专利信息
设备故障分析
预估系统
历史设备
设备加工过程
设备故障率
模糊故障
故障检测滤波器
无人船系统
分布式故障检测
模糊规则
系统故障检测方法
离散系统
残差生成器
动态数学模型
协方差矩阵
关键点
路径规划方法
决策方法
动态贝叶斯网络
深度图
预警方法
历史运行数据
深度置信网络
嵌套滑动窗口
异常检测器