摘要
本发明公开了一种无人机集群协同目标跟踪策略的获取和在线更新方法及装置,所述方法包括:将策略网络Actor网络和评价网络Critic网络部署至各无人机飞控系统,并为每架无人机创建镜像智能体。实时获取各无人机的观察信息,将其输入至各无人机的策略网络Actor网络和镜像Actor网络,生成相应的飞行策略。驱动无人机根据飞行策略执行飞行动作后,获取无人机的第一累积奖励值,镜像智能体根据镜像飞行策略执行虚拟飞行动作后估算奖励值并获取第二累积奖励值。每驱动无人机执行预设次数飞行策略后,更新无人机的策略网络Actor网络、评价网络Critic网络以及镜像网络的参数。通过实施本发明能够提高跟踪策略的准确性。
技术关键词
无人机集群协同
在线更新方法
镜像
策略
仿真环境
无人机飞控系统
执行飞行动作
网络部署
参数
无人机模型
驱动无人机
时序误差
在线更新装置
模块
样本
指令
运动
模式