摘要
本发明公开了一种基于TD‑MATD3的海上无人艇集群路径规划方法,该方法包括:将海上无人艇集群路径规划任务分解为导航任务模块以及避障任务模块,并分别设计分解式Actor‑Critic网络;设计基于编队保持奖励的优化方法,通过计算无人艇之间实际相对距离与期望最优距离的偏差生成额外距离奖励信号,并与导航任务奖励、避障任务奖励共同参与策略优化;设计基于学习潜力的经验回放机制,通过时间差分误差和即时奖励值对样本进行学习潜力得分计算,以优先选择学习潜力得分高的样本参与训练;将基于学习潜力的经验回放机制与MATD3算法结合,更新两个任务模块的网络参数,最终生成无人艇集群的最优路径规划策略。本发明能够生成海上无人艇集群的最佳路径规划策略。
技术关键词
海上无人艇
路径规划方法
无人艇集群
导航特征
更新网络参数
障碍物
样本
模块
误差
策略
机制
处理器
实时位置
程序
指令
计算机设备
系统为您推荐了相关专利信息
虚拟惯性控制
调频
风储系统
量化评估方法
有功功率
智能路径规划方法
RFID标签信息
物流无人机
策略
包裹
笛卡尔
机械臂末端执行器
移动机器人系统
终点
姿态偏差