摘要
本发明涉及一种视线引导与自专家克隆融合强化学习的无人船路径跟踪方法,所述方法包括:步骤1、无人船搭建路径跟踪仿真训练环境;步骤2、无人船构建视线算法引导模块,利用视线算法计算目标航向,并基于航向偏移调整自身路径跟踪策略,从而为强化学习智能体的决策与训练提供引导;步骤3、无人船对静水条件下的路径跟踪任务进行马尔科夫决策过程建模;等步骤。本发明优越技术效果是,所述方法使用强化学习框架,支持强化算法的自动迭代和优化;引入视线算法引导强化学习更新,降低解空间复杂度并提升鲁棒性;使用自专家克隆进行预训练,提升训练初期表现。
技术关键词
无人船
路径跟踪方法
静水环境
三元组
强化学习算法
网络
策略更新
控制误差
决策
缓冲池
仿真训练系统
强化学习框架
数据
仿真场景
算法模块
仿真系统
系统为您推荐了相关专利信息
模型预测控制器
深度强化学习
四轮转向车辆
车辆前轴
标定方法
网络流量数据
历史流量数据
智能网关
身份认证模块
数据总线