摘要
本发明公开了多AGV深度强化学习动态路径规划方法,创建虚拟仓储仿真训练环境,并从所述虚拟仓储仿真训练环境中提取虚拟仓储仿真训练环境信息,依据ros操作系统搭建仿真环境,搭建AGV模型。本发明从AGV摄像头中获取的原始图像中获取最优动作。省去了人为的提取特征的步骤,此外,引入动态分组机制,通过评估网络和注意力网络对多个AGV进行动态分组,并通过通信网络进行AGV之间的通信,结合深度强化学习对网络参数进行训练,解决了多个AGV无冲突路径规划过程中在多AGV联合决策时出现的维度灾难问题。
技术关键词
动态路径规划方法
深度强化学习
路径规划器
表征场景
动态障碍物
多通道
静态障碍物
深度神经网络
图像
通信网络
仿真环境
全局路径规划
决策
注意力
编码
操作系统
系统为您推荐了相关专利信息
运动规划系统
静态障碍物
局部路径规划
全局路径规划
动态障碍物
轨迹规划方法
深度强化学习
动态障碍物
连线
记忆
调控方法
交互特征
递归神经网络
多任务深度学习模型
深度强化学习算法
交叉注意力机制
视觉导航方法
融合视觉导航
模块
视觉特征
视频异常检测方法
视频监控数据
视频帧
大语言模型
编码模块