摘要
本发明涉及一种无人艇自主导航方法、终端设备及存储介质,该方法中,将无人艇的导航问题建模为马尔科夫决策过程,并将状态空间划分为全局状态和局部状态;针对全局状态和局部状态分别通过自注意力机制得到各自对应的特征向量,并结合全局地图中船舶所处位置对应的有效信息区域的边界得到全局状态有效信息的特征向量后,将全局状态有效信息的特征向量与局部状态的特征向量加权求和后得到的综合特征向量输入至Actor‑Critic网络进行决策。本发明能够在复杂的狭水道环境中实现无人艇的自主航行与避碰决策,提高了模型的收敛速度、决策能力和泛化能力。
技术关键词
自主导航方法
船舶运动数学模型
无人艇
全局地图
强化学习模型
导航终端设备
决策
注意力机制
风险
可读存储介质
处理器
速度
存储器
计算机
轨迹
算法
网络
系统为您推荐了相关专利信息
消防机器人
深度强化学习模型
运营方法
火灾
生成反馈信号
流媒体服务器
遗传算法
强化学习模型
客户端
策略
协同调度方法
两阶段
历史功率数据
深度强化学习模型
模型训练方法