摘要
本发明涉及一种基于深度强化学习的无人船路径跟踪控制方法,包括以下步骤:步骤1、构建融合多元环境要素的时变海洋环境模型;步骤2、基于步骤1的海洋环境模型将无人船路径跟踪控制问题建模为基于马尔可夫决策过程的求解框架;步骤3、基于步骤2的求解框架,使用改进的Twin Delayed Deep Deterministic policy gradient(TD3)算法对无人船路径跟踪控制进行优化求解;步骤4、使用步骤3中训练好的策略神经网络控制无人船执行路径跟踪任务。本发明提出的基于深度强化学习的无人船路径跟踪控制方法采用改进的TD3算法进行策略训练与优化,显著地提高了控制策略的收敛速度,实现了在动态和复杂的海洋环境中准确且可靠的路径跟踪效果。
技术关键词
路径跟踪控制
深度强化学习
控制策略
无人船感知
无人船智能
加权插值法
神经网络参数
控制螺旋桨
决策
网格方法
速度
误差
定义
算法
系统为您推荐了相关专利信息
车载空调出风口
控制策略
车辆状态数据
能耗预测模型
乘员
智能切换方法
深度强化学习
智能车
策略
计算中心
整车动力系统
能量管理策略
燃料电池输出功率
车辆混合动力系统
蓄电池
滚动优化调度方法
功率校正
曲线
基准
光伏发电机组