摘要
本发明一种基于两阶段安全强化学习的船舶避碰决策方法,包括以下步骤:构建第一阶段强化学习船舶避碰决策模型,用于船舶在周围第一阈值内有其他船舶或障碍时,船舶采取避碰行动;并构建第二阶段安全强化学习船舶避碰决策模型,用于船舶在周围第二阈值内有其他船舶或障碍时,限制船舶动作空间以保证船舶航行安全性;在第一阈值条件时,采用训练好的第一阶段强化学习船舶避碰决策模型进行船舶行驶过程中的避碰决策;当船舶与其他船舶或障碍物,在第二阈值条件时,采用训练好的第二阶段安全强化学习船舶避碰决策模型进行船舶行驶过程中的避碰决策。本发明提升了船舶航行的安全性和经济性,为强化学习避碰算法提供一种安全保障。
技术关键词
船舶避碰决策方法
强化学习算法
船舶运动模型
两阶段
避碰规则
碰撞检测模块
节点
场景
识别模块
障碍物
表达式
避碰算法
风险
决策树模型
终点
标记