摘要
本发明涉及基于RRT路径智引无人船强化学习的路径规划方法及装置,通过以一条RRT*算法规划出来的最优路径path(可能为局部最优)作为无人船强化学习的参考,并将此路径加入到无人船强化学习中,通过计算无人船在探索时与path的水平距离Δxt的平方,以此计算结果来作为常数N的除数,最终得出一个奖励值Rt,给此奖励函数命名为“N‑距离衰减奖励方程”。通过引入“N‑距离衰减奖励方程”,可以使无人船在探索时减少探索时间,进而提高无人船找到最优路径的效率。并且由于使用了RRT*路径来引导无人船,相较于RRT路径来引导更可能达到最优路径。
技术关键词
无人船
Sarsa算法
路径规划方法
节点
方程
路径规划装置
危险区
终点
软件
算法规划
编程
运动
输出模块
坐标
障碍物
程序
参数
系统为您推荐了相关专利信息
任务分配方法
任务分配算法
匈牙利匹配算法
载荷
规划
金融
节点
数据存储
计算机执行指令
数据管理方法