摘要
本发明公开了一种基于分层多智能体强化学习的多无人机调度方法,建立分层强化学习框架指导多无人机调度,所述分层强化学习框架包括上层管理者的指令生成和下层无人机的指令学习;上层管理者收集下层无人机的视野信息,对下层无人机给出更长时间尺度上的策略;下层无人机利用后继状态特征自动学习上层管理者发送的指令集,依据上层管理者发送的指令集和当前的视野观测执行具体决策。上述方法能实现多无人机协作的同时,增加对不同环境和不同无人机编队组成的泛化能力,增强算法的可扩展性,可应用于无人机提供临时通信服务、无人机物联网构建、移动边缘计算、多无人机跟踪等多无人机任务。
技术关键词
无人机调度方法
多智能体强化学习
分层强化学习
多无人机
策略
编码器
指令
轨迹
无人机编队
决策
强化学习算法
智能体系统
笛卡尔
表达式
视野
框架
通信服务
解码
系统为您推荐了相关专利信息
电力系统强迫振荡
滑模观测器
估计方法
矩阵
发电机模型
人体动作识别方法
注意力
多模态
模态特征
融合特征
电压平衡单元
超级电容装置
隔离栅极驱动器
超级电容器系统
滤波单元