摘要
本发明公开了一种基于强化学习的海床履带机器人路径规划方法及系统,包括:利用多传感器实时获取环境数据,结合神经网络提取海底地形三维特征、障碍物分布及海流动态参数进行联合特征提取;建立海床环境仿真模型,并利用对抗生成技术合成多种地貌训练数据;设计分层强化学习框架,全局层通过分布式智能体协作优化长距离路径,局部层设计高频控制策略,全局与局部策略通过动态权重调整机制实现多维度协同优化;通过在线优化模块实现动态环境下的模型参数实时更新,通过迁移学习将仿真策略快速部署至实体机器人。本发明构建了神经网络特征提取与多层级强化学习协同的自主决策系统,为深海作业场景提供了高可靠、低能耗的自主作业解决方案。
技术关键词
自主路径规划方法
履带机器人
全局路径规划
联合特征提取
分层强化学习
实体机器人
迁移学习技术
强化学习策略
数字孪生系统
双向注意力
生成技术
动态障碍物
多传感器
路径规划系统
仿真模型
仿真平台
系统为您推荐了相关专利信息
多传感器融合
室内动态环境
协方差矩阵
避障算法
动态窗口法
手持控制设备
工作设备
采集电极
参数
运动传感器
供应链优化方法
分层强化学习
数字孪生模型
车辆
决策系统
智能监控方法
金花茶
传感器阵列
蒲公英
时序特征