摘要
本发明提供一种基于分层PPO架构的无人机群覆盖多目标优化方法,属于无人机辅助边缘计算与人工智能优化交叉领域。步骤为:首先,构建约束马尔可夫决策过程,对多目标优化问题建模;其次,拉格朗日对偶法转换约束;再次,设计、优化分层PPO架构;最后,训练分层PPO算法,训练过程遵循递进关系逐步引入约束。本发明提出将空间配置优化与时间调度优化相结合,通过分层PPO架构有效应对交通数据新鲜度约束及终端设备移动性问题;首次将峰值AoI指标嵌入强化学习奖励函数中,并融合时空注意力机制和功率控制策略,对数据采集频率及跨层干扰进行动态调节,辅助无人机动作决策过程,支持大规模无人机群动态协作。
技术关键词
拉格朗日对偶
分层
时空注意力机制
大规模无人机
双时间尺度
动态协作
样本
控制器
关键区域信息
多重约束条件
信息交换机制
人工智能优化
多智能体协同
功率控制策略
决策
控制智能体
数据采集频率
系统为您推荐了相关专利信息
交互特征
决策
推荐方法
深度学习模型
多源异构系统
有功功率控制方法
互补系统
计算机可执行指令
充放电策略
调度优化模型
数据对账方法
加密数据
医保结算系统
医院HIS系统
长短期记忆网络
螺丝
多模态深度学习
机器视觉系统
路径规划算法
深度学习多任务网络