摘要
本发明公开了一种面向无人机通信基站的多智体强化学习区域调度方法,包括:每一时刻,每个区域的地面基站向飞行至该区域的无人机发送协助通信的申请;设置在所述无人机上的无人机基站响应后反馈给地面基站,地面基站根据响应的无人机基站数量,发送控制命令让无人机执行协助通信服务或者待机,无人机将控制命令结果及自身状态信息定时反馈给地面控制中心;地面控制中心根据所有无人机反馈的控制命令结果,采用多智体强化学习调度方法,获得并更新每个无人机的区域调度策略,无人机根据该策略在下一时刻收到协助通信的申请时,做出决策;重复执行前述步骤,完成面向无人机通信基站的多智体强化学习区域调度。
技术关键词
面向无人机通信
强化学习调度方法
无人机基站
控制中心
特征字典
动作策略
稀疏算法
通信服务
地面
无人机所处区域
梯度方法
高斯径向基函数
全局状态信息
核方法
命令
网络
决策