摘要
本发明公开了基于语义强化学习的自主水下机器人轨迹跟踪控制方法,包括:获取海洋环境图像信息;进行强化学习训练,得到最优的运动决策;进行海洋环境特征点提取和语义理解,得到海洋环境语义;判断自主水下航行器的运动决策是否安全,若安全,则执行运动决策,否则对不安全的动作,在安全约束下利用强化学习重新做出新的运动决策,若仍不安全,则存储当前不安全事件并基于状态恢复机制重训练。本发明使自主水下机器人能够更好的理解环境信息以及变化,预测潜在的危险,能够保证自主水下机器人的安全性,一旦自主水下机器人发生碰撞,能够自动恢复到上一个最优安全状态,而不是恢复到初始状态重新开始训练,提高训练效率。
技术关键词
自主水下机器人
轨迹跟踪控制方法
动态障碍物
海洋环境特征
自主水下航行
决策
特征点
图像
因子
策略
轨迹跟踪控制器
运动
安全事件信息
语义分割网络
解码器
机制
视觉传感器
感兴趣
电缆
系统为您推荐了相关专利信息
工业自动化智能
激光雷达传感器
移动装置
麦克纳姆轮
地图构建单元
性能测试分析方法
涂层
性能测试数据
钢结构
海洋环境数据
动态障碍物
路径规划方法
卡尔曼滤波
人流量信息
单目相机
三维动态避障
低空无人机
静态障碍物
保护区
偏转角