摘要
本发明涉及基于RRT算法的无人水面艇强化学习路径规划方法及装置,包括以下:基于RRT算法对无人水面艇于目标环境中进行规划得到第一路径;对所述第一路径中的每个节点,通过计算奖励的方式进行训练确定该节点的无人水面艇自动操作策略;重复对所述第一路径中的每个节点进行训练直到达到拟合状态,此时得到优化后的第一路径,优化后的第一路径中的每个节点的无人水面艇自动操作策略均达到最优;以优化后的第一路径对无人水面艇进行自动控制。本发明可以使无人水面艇更快找到终点,减少训练次数,更快的到达拟合的状态,实现路径规划的作用,同时结合无人水面艇船舶实际特性,更加贴切实际。该方法也提高路径搜索速度,避免了路径生成的随机性。
技术关键词
无人水面艇
学习路径规划方法
RRT算法
栅格地图
策略
坐标
采取行动
路径规划装置
强化学习算法
横摆角速度
条目
节点处
控制模块
舵机
终点