摘要
本发明公开了基于语义强化学习的自主水下机器人轨迹跟踪控制方法,包括:获取海洋环境图像信息;进行强化学习训练,得到最优的运动决策;进行海洋环境特征点提取和语义理解,得到海洋环境语义;判断自主水下航行器的运动决策是否安全,若安全,则执行运动决策,否则对不安全的动作,在安全约束下利用强化学习重新做出新的运动决策,若仍不安全,则存储当前不安全事件并基于状态恢复机制重训练。本发明使自主水下机器人能够更好的理解环境信息以及变化,预测潜在的危险,能够保证自主水下机器人的安全性,一旦自主水下机器人发生碰撞,能够自动恢复到上一个最优安全状态,而不是恢复到初始状态重新开始训练,提高训练效率。
技术关键词
自主水下机器人
轨迹跟踪控制方法
动态障碍物
海洋环境特征
自主水下航行
决策
特征点
图像
因子
策略
轨迹跟踪控制器
运动
安全事件信息
语义分割网络
解码器
机制
视觉传感器
感兴趣
电缆
系统为您推荐了相关专利信息
管道机器人
关节单元
导航方法
人工势场法
传感器模组
推进器
轨迹预测模型
轨迹跟踪控制方法
序列
强化学习模型
跟随控制方法
车辆
跟随算法
数据获取模块
控制模块