摘要
本发明涉及基于静态奖励驱动的RRT算法的无人船路径规划方法及装置,对终点附近范围内对纵坐标进行梯度化,在不同梯度选取不同奖励系数,在根据横坐标差值,对无人船具体位置进行奖励值确定,通过这一系列操作实现对奖励值梯度化,在一定的梯度范围内,奖励值的确定主要由x坐标的差距进行决定,使得无人船训练的路径能够更加迅速的收敛于参考路径,这样不但可以有效的解决在不同点的奖励值多样化造成的最优路径收敛慢等问题。还可以使得无人船在距离终点越近对强化学习算法学习速率和更新速率更快,能够解决在以往的无人船路径规划任务中,由于奖励函数设计不合理或奖励值收敛不集中,规划可能存在效率低下、任务无法完成或操作不准确的问题。
技术关键词
RRT算法
无人船路径规划
坐标
终点
场景
生成随机
强化学习算法
模块
数据更新
障碍物
节点
速率
两点
地图
概念
系统为您推荐了相关专利信息
智能灯杆
环境图像数据
智慧灯杆
风险
图像特征数据
场景类别
商品图像特征
动态展示方法
高斯混合模型
动态场景