摘要
本发明提出了基于联邦深度强化学习的多无人机内容缓存与轨迹规划方法,包括:构建空地无线通信缓存网络,获取空地无线通信缓存网络的累计平均吞吐量;基于所述累计平均吞吐量,构建无人机轨迹的优化目标函数;将无人机中的缓存替换模型构建为第一MDP模型,将无人机的轨迹设计构建为第二MDP模型;基于所述优化目标函数,采用联邦深度强化学习的算法,计算所述第一MDP模型和第二MDP模型的全局参数,基于所述全局参数进行多无人机轨迹规划与缓存替换。本发明在保护隐私的前提下能够进行更充分的探索,以解决缓存命中和用户的公平通信问题。
技术关键词
深度强化学习
轨迹规划方法
旋翼
构建无人机
加速度
多无人机
噪声功率谱密度
缓存替换策略
推力
分布式代理
缓存命中率
指数
决策
网络
参数
算法
数据
制动盘
系统为您推荐了相关专利信息
电机控制器
无线收发模块
控制单元
无线收发功能
控制模块
实时数据
可再生能源
电网运行优化方法
接入点
动态
抽水蓄能电站机组
优化调度模型
深度强化学习算法
蒙特卡洛树搜索
系统优化调度方法
航天器
李雅普诺夫函数
跟踪控制方法
状态观测器
坐标系