摘要
本发明提供一种用于未知环境的水下机器人路径规划方法,水下机器人路径规划技术领域。本发明通过M‑DQN水下机器人路径规划模型进行未知环境水下路径规划,其训练为:水下机器人通过MOA机制选择下一步动作与水下环境进行交互;根据交互反馈通过奖励机制对当前动作进行奖励或惩罚,并将动作经验存储至分层经验池中;当动作经验积累到预设数量时,从分层经验池中利用分层提取机制提取批量动作经验进行学习;循环上述过程直到触碰障碍物或抵达目标点,结束本轮学习;对每轮学习进行评估,根据评估结果进行奖励回馈,被回馈的奖励值将参与下一轮的训练。提升了水下机器人的学习效率,避免了传统方法中因训练不充分而导致的路径规划精度不足的问题。
技术关键词
水下机器人
分层
机制
障碍物
规划
批量
代表
动态
精度
运动
系统为您推荐了相关专利信息
可靠性优化方法
概率密度函数
轨迹
风险控制策略
动态
LED屏控制系统
低功耗
预测误差
光强
修正误差
舞蹈机器人
动作控制方法
音乐特征提取
动作控制系统
姿态关系
动态监测方法
高风险
算法
网络安全防护系统
流量监控设备