基于世界模型隐变量和强化学习的AGV路径规划方法和装置

正文

推荐专利

申请号：CN202410828611

申请日期：2024-06-25

公开号：CN118839831A

公开日期：2024-10-25

类型：发明专利

摘要

基于世界模型隐变量和强化学习的AGV路径规划方法和装置，其方法包括：对车间环境进行建模，生成起始点、目标点、AGV、静态障碍物及动态障碍物，并以栅格地图的方式对其进行像素点表示，将地图表示为图像的形式，获取初始时刻t0至tn的地图信息，作为世界模型学习网络dreamer的输入，生成离散世界模型；建立以结合障碍物分布和时间成本的奖励函数为基础的Actor‑Critic网络，以离散世界模型作为输入，Actor网络预测当前时刻t至后续t+15时刻的AGV动作，Critic网络根据奖励函数对动作进行奖惩；最后使用训练好后的动作网络对AGV进行路径规划。该方法可以减少AGV与环境的交互次数，减少训练的成本与时间，避免在真实环境下训练AGV可能出现的故障。

技术关键词

路径规划方法变量动态障碍物静态障碍物神经网络参数栅格地图 AGV路径规划卷积神经网络学习车间图像重建路径规划装置更新网络参数决策隐性特征

系统为您推荐了相关专利信息

一种检测障碍物的方法及装置

检测障碍物点云感兴趣卡尔曼滤波算法聚类算法

终端设备远程维护方法、装置、设备和计算机存储介质

光流特征视频帧特征挖掘算法关系终端设备

基于自步学习加权的在线图像哈希检索方法及系统

图像哈希检索方法迭代优化算法数据样本矩阵

基于克里金插值与分类回归树的盾构施工土方量预测方法

量预测方法分类回归树插值模型融合策略参数

一种考虑风险驱动的长时序运行模拟场景解耦加速求解方法

时序运行模拟加速求解方法场景典型变量

基于世界模型隐变量和强化学习的AGV路径规划方法和装置

站点导航

APP 下载