摘要
本发明公开了一种基于强化学习的多无人机辅助移动边缘计算轨迹规划方法。针对移动边缘计算(MEC)系统中无人机能源受限、局部信息协作困难的问题,将轨迹规划建模为分布式部分可观测马尔可夫决策过程(Dec‑POMDP),通过定义状态空间、动作集合、状态转移和奖励函数,引入队友建模网络学习其他无人机策略分布,结合深度强化学习算法优化轨迹与充电调度。实验表明,该方法可显著降低任务无人机宕机风险,提升系统计算任务量和服务连续性,在动态复杂场景中具备强适应性。
技术关键词
充电无人机
深度强化学习算法
轨迹规划方法
无人机电量
宕机
充电调度策略
状态转移模型
优化网络参数
更新网络参数
无人机协同
最大化系统
批量数据
定义系统
连续性
系统为您推荐了相关专利信息
发送波束成形
深度强化学习算法
发送功率控制
无人机飞行轨迹
通信系统
动态障碍物
连续动作空间
空气动力学原理
模拟无人机
强化学习框架
关键节点识别
多模态网络
网络融合方法
人类免疫缺陷病毒
节点特征
人工智能决策
多自由度机械臂
视觉人工智能
深度学习算法
运动控制决策