摘要
本发明的一种基于深度强化学习的水下机器人编队的路径规划方法,包括:对海洋环境进行三维建模,进行初始化设置;在跟随者‑领航者编队中引入虚拟领航者并改进编队保持方式;使用深度强化学习算法在建模场景中对水下机器人编队路径规划进行训练,不断试错迭代,训练网络模型;在深度强化学习训练水下机器人路径规划时引入人工势场法;将训练好的网络模型与LOS制导算法通过TCP/IP进行通讯实现深度强化学习在水下机器人中进行实时决策,达到编队路径规划的效果;在LOS制导实时反馈和深度强化学习实时决策之间不断交互,为水下机器人编队提供实时的路径规划并最终到达目标点。
技术关键词
路径规划方法
虚拟领航者
人工势场法
深度强化学习算法
水下机器人系统
深度强化学习模型
障碍物
制导算法
分层强化学习
决策
网络
仿真环境
空间直角坐标系
分层策略
推力
系统为您推荐了相关专利信息
区域无人机
路径规划方法
滑动窗口
数据处理模块
模式决策算法
三维建筑信息
逃生路径规划系统
逃生路径规划方法
动态实时数据
有向图结构
任务调度执行方法
强化学习模型
实时状态信息
计算机可读指令
遗传算法
无人化采煤工作面
路径规划方法
高斯算法
煤层顶板
三维模型