摘要
本申请公开了一种多AGV调度方法、装置、设备及存储介质,涉及物流仓储技术领域。该方法包括:收集实时环境信息并通过深度编解码网络建模为实时环境状态表示;构建基于扩散模型和多智能体强化学习的多AGV动态调度模型并利用实时环境状态表示对多AGV动态调度模型进行训练,以得到目标多AGV动态调度模型;其中,扩散模型使用无分类器指导以及在预设低温范围内进行采样,以及基于去噪扩散概率模型的训练方式生成动作序列;多智能体强化学习采用集中训练和分散执行的训练框架;将目标环境信息动态输入目标多AGV动态调度模型,以动态输出多AGV的动作序列。通过本申请的技术方案,可以实现多AGV动态调度并提升多AGV调度的效率。
技术关键词
动态调度模型
多智能体强化学习
生成动作
地图模块
编解码
序列
存储计算机程序
分类器
物流仓储技术
随机噪声
随机梯度下降
深度神经网络
调度装置
样本
电子设备
框架
数据
系统为您推荐了相关专利信息
高分辨率纹理
图像超分方法
图像分割方式
噪声
图像缩放
舒适度
事件驱动型
流式数据处理引擎
会议
子模块
语义特征
信道解码器
信道编码器
识别模块
协同频谱感知方法