摘要
本发明公布了融合经验共享与平衡奖励Actor‑Critic网络的编队路径规划方法,所述方法首先构建无人机编队路径规划的任务场景;其次通过设定编队与路径规划平衡奖励,根据稀疏性和信息性准则求解平衡的编队奖励和路径奖励;然后根据经验共享策略使得每个无人机能够在自身学习探索的同时获取其他无人机的学习经验;最后在对整个模型完成训练后,在动态环境下实现了无人机编队路径规划。本发明基于多智能体演员‑评论家算法基本框架,利用平衡奖励设定编队与路径规划奖励,提出经验共享策略,有效解决了编队路径规划方法收敛速度较慢的问题,可确保编队无人机实现高效路径规划。
技术关键词
路径规划方法
策略
更新网络参数
终点
构建无人机
编队无人机
表达式
距离信息
场景
定义
障碍物
算法
速度
决策
总量
系统为您推荐了相关专利信息
大语言模型
迁移方法
意图识别
结构化网页
搭建测试环境
设备状态监测方法
设备状态监测系统
设备状态监控
数据获取单元
矩阵
机械臂路径规划方法
障碍物
采样点
扩展随机树
节点连线
故障诊断方法
风电轴承
轴承故障诊断技术
算法
风机轴承