摘要
本发明公开了一种自动化物流场景下基于Transformer的多机器人协同工作方法及系统,包括:每个机器人获取当前环境的一个不完全观测信息,分别进行时序建模、空间建模,生成Q值,选择动作以及获得奖励值。并且在这过程中将每个机器人的不完全观测信息,当前环境的全局状态信息以及奖励值存放到一个经验回放池B中,重复上述步骤最后利用B中存储的数据完成模型最优化,解决了在多机器人协同工作过程中的部分可观测问题和信誉分配问题。
技术关键词
机器人协同工作
全局状态信息
注意力机制
时序
周围环境信息
混合网络
多层感知机
数据获取模块
物流
超参数
场景
掩码矩阵
障碍物
代表
在线
系统为您推荐了相关专利信息
注意力模型
图像分割方法
积层
全局平均池化
图像分割系统
高效节能控制
成套设备
工业炉
强化学习策略
吸收光谱仪
深度学习预测
深度学习模型
关节
控制外骨骼系统
惯性传感单元