摘要
本发明提出了一种基于图强化学习的多AGV分布式路径规划方法,用于解决多AGV系统在信息受限动态环境中的路径规划效率低下的技术问题。本发明的步骤为:建立多AGV协同路径规划中的动态异构图模型;结合路径规划与协同决策,基于图结构构建分布式部分可观测马尔可夫决策模型;基于图神经网络与多头注意力机制的多智能体深度强化学习框架,设计一种应对信息受限动态环境下的多AGV协同路径规划算法,通过调整动态异构图中节点和边的权重,在局部感知和邻域交互的基础上实现信息聚合,实时更新和适应环境的变化。本发明能够在信息受限的动态环境中通过信息聚合机制提高路径规划效率,通过图神经网络优化多AGV协同路径规划,确保系统的高效稳定运行。
技术关键词
协同路径规划
路径规划方法
多头注意力机制
节点特征
异构
路径规划决策
神经网络模型
路径规划效率
实体
深度强化学习
动态更新
多AGV系统
Softmax函数
数据获取节点
障碍物
系统为您推荐了相关专利信息
识别方法
神经网络模型
像素点
红外成像设备
动态
电池包
时间序列特征
健康状态预测方法
多头注意力机制
编码器
邻居
节点
路径规划方法
循环卷积网络
深度学习网络
新能源场站
多源异构数据
日志
长短期记忆网络
重构系统