摘要
本发明公开了一种船舶轨迹规划方法,包括S1:选定船舶轨迹规划区域为任务区域,并设置任务区域内船舶行驶轨迹的起点和终点;S2:获取任务区域内AIS历史报文进行预处理并从中获取船舶行驶的历史轨迹信息;S3:使用模仿学习方法提取历史轨迹信息中包含的专家策略;S4:获取船舶的状态和航行性能构建强化学习的状态空间和动作空间;S5:获取船舶航行的安全要素构造船舶航行策略的奖励函数;S6:通过价值惩罚的方式将专家策略引入到强化学习模型中,并使用专家策略引导强化学习模型进行训练;S7:将训练好的强化学习模型用于船舶的轨迹规划。本发明提高了强化学习的效率,还将规划轨迹纳入了人类的先验知识,使轨迹更加合理可靠。
技术关键词
船舶轨迹规划方法
强化学习模型
模仿学习方法
强化学习策略
电子海图
时间差
船舶运行状态
动态数据处理
船舶吃水深度
学习算法
报文
网络
栅格
训练分类器
系统为您推荐了相关专利信息
强化学习模型
网络异常流量检测
分类器
主成分分析方法
静态特征
强化学习模型
数字带阻滤波器
复杂度
界面
环境光照强度
封堵加固方法
注浆参数
多智能体深度强化学习
注浆设备
强化学习策略
动态调度方法
协同决策机制
深度强化学习算法
动态障碍物
停车场车位状态
协同控制方法
环境特征点
多模态
群体智能模型
强化学习模型