摘要
本发明公开了一种基于图搜索引导强化学习的无人夹抱车仓储区路径规划算法,包括以下步骤:步骤1,采集仓储环境数据,生成环境地图;步骤2,根据步骤1的环境地图以及给定目标点,使用图搜索算法规划出粗略路径的路径点步骤3,强化学习优化模块中的Actor网络生成路径的路径点计算即时奖励rt,将步骤2中的粗略路径作为强化学习模块的引导,Critic网络使即时奖励rt输出逼近真实的状态‑动作值函数,计算均方误差损失函数Lcritic,更新Critic网络参数θcritic,Critic网络综合步骤2的粗略路径和Actor网络生成路径计算相似性损失函数Lsimilarity,Actor网络的损失函数Lactor由Lcritic和Lsimilarity加权所得。本发明提出的无人夹抱车仓储区路径规划算法,生成的路径更平滑且避障性能更强。
技术关键词
路径规划算法
夹抱车
网络
粗略
搜索算法
障碍物
生成环境地图
激光雷达
参数
仓库环境
点云
误差
融合策略
终点
深度相机
模块
数据
动态
系统为您推荐了相关专利信息
贝叶斯网络模型
比例风险模型
节点
数控机床
历史故障数据
预训练模型
可见光图像
图像去雾方法
去雾模型
图像去雾装置