摘要
本申请公开了一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法、装置、介质和设备,通过在无人机博弈环境中,构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型;基于无人机集群博弈深度强化学习算法与运动学模型和控制模型交互得到环境状态信息,得到各奖励函数差值;判断各奖励函数差值的绝对值均小于预设阈值,利用预设的分辨率参数更新算法更新分辨率缩小倍数参数,以更新运动学模型和控制模型;将自适应迭代分辨率的无人机集群博弈深度强化学习算法部署于各参与博弈的无人机智能体中,并利用智能体指导无人机在博弈环境中做出最优决策,本申请该方法通过动态调整策略更新的分辨率,显著提升了训练效率和收敛速度。
技术关键词
深度强化学习算法
分辨率
环境状态信息
博弈方法
无人机集群
训练无人机
构建无人机
参数
输入输出单元
博弈装置
偏转角
决策
存储计算机程序
策略更新
加速度
电子设备
系统为您推荐了相关专利信息
智能调度方法
深度强化学习算法
时延
任务调度
服务器