摘要
本发明公开了一种基于分布式强化学习算法的多飞行器协同非合作目标捕获方法,包括以下步骤:设置无人机群对目标进行拦截的仿真环境,获取飞行信息存储至经验池中;通过策略网络从经验池中采样数据,生成机动策略,无人机根据机动策略进行机动动作;通过评价网络评价机动策略的价值,将价值存储至经验池中;从经验池中采样数据,对策略网络进行参数更新;多次更新获得策略模型,将策略模型设置于无人机上,无人机根据策略模型输出的机动策略进行飞行,实现对目标的拦截。本发明提供的基于分布式强化学习算法的多飞行器协同非合作目标捕获方法,提高了训练效率,获得的机动策略更加精准。
技术关键词
分布式强化学习
捕获方法
无人机
策略
飞行器
网络更新过程
算法
仿真环境
参数
回放方法
数据
集群
批量
因子
误差
速度