摘要
本申请涉及一种基于分层强化学习的路径规划方法、装置、设备和介质,通过将任意一平面地图转化为栅格化后,在避免碰撞障碍物的约束下将起点位置和终点位置之间路径最短作为优化目标,从起点位置开始选择多个子目标位置,直至到达终点位置,将起点位置和终点位置之间的路径规划问题,转换为多个局部子路径规划问题,接着采用人工神经网络作为A*算法中的启发式函数构建学习启发式网络,并利用强化学习对所述学习启发式网络进行训练,利用训练后的学习启发式网络对各局部子路径规划问题进行求解,得到各局部子路径的最优解,继而得到有界次优路径规划结果。采用本方法在任一平面地图上,高效的进行路径规划。
技术关键词
分层强化学习
路径规划方法
终点
人工神经网络
强化学习方法
地图
栅格
路径规划装置
障碍物
距离估计
算法
处理器
计算机设备
模块
可读存储介质
决策
存储器
节点
系统为您推荐了相关专利信息
消化道置管
路径规划方法
三维点云模型
编码器
网络模块
多时间尺度
分层强化学习
生成动作
迁移技术
无功功率调节
水下环境监测
机体
路径规划系统
空间避障
监测水下环境
桥梁抗震
关键结构参数
性能评估方法
模型库
地震
散斑图像
测量方法
特征点
图像配准
圆柱滚子轴承内圈