摘要
本发明涉及一种多无人机辅助移动边缘计算轨迹优化方法、装置和设备,首先构建多个模型,具体为:用户关联模型,用于定义无人机和计算任务间的对应关系;无人机移动模型,用于约束无人机和用户位置的位置并避免无人机相撞;任务计算模型,用于计算任务执行时间;无人机能耗模型,用于约束无人机能耗。接着在上述模型的基础上构建无人机的深度强化学习模型,分别定义局部观测、全局观测、动作、奖励等参数含义,其中,根据无人机的移动角度和距离定义动作,根据任务执行总时间和任务响应失败率等定义奖励函数,最大化奖励函数以实现无人机的轨迹优化。采用本方法能够找到具有最小任务完成时间和任务请求失败率的卸载决策和移动轨迹。
技术关键词
构建无人机
深度强化学习模型
轨迹优化方法
能耗
多无人机
定义
网络架构
周期
参数
时序
数据
因子
噪声功率
优化装置
阶段
误差
模块