摘要
本申请实施例提供了一种船舶自动靠泊控制方法、系统、电子设备及存储介质,属于船舶控制技术领域。该方法获取当前船舶的运动状态数据和距离目标泊位的第一相对距离,将运动状态数据和第一相对距离输入用于船舶自动靠泊的控制策略模型,得到下一时刻的船舶控制量。控制策略模型基于强化学习算法训练得到,即获取环境交互数据,通过最大化目标函数,根据环境交互数据训练价值网络,并根据价值网络和环境交互数据训练策略网络,其中,目标函数表征策略网络输出的动作的累计奖励值,动作表征船舶控制量,然后根据训练好的策略网络确定控制策略模型。本申请能够减少船舶自动靠离泊算法建模的工作量,提高建模精度,提高船舶自动靠泊过程安全性。
技术关键词
船舶自动靠泊
控制策略模型
强化学习算法
强化学习环境
泊位
采集运动状态
船舶控制技术
电子设备
处理器
进程
微波雷达
网络控制
数据总线
存储器
程序
系统为您推荐了相关专利信息
模糊控制算法
PLC控制器
变量
云平台
模糊规则库
强化学习算法
通信控制方法
多路径
网络
列车通信技术
减震控制系统
海上风电机组
协同控制策略
深度神经网络模型
模式切换模块