摘要
本发明公开了基于神经注意力增强型Q学习的集群调度方法,包括以下步骤:设置仓储机器人集群调度的约束条件;每个仓储机器人包括融合门控循环单元和多层感知器的神经网络架构;通过采用参数共享策略,所有机器人共用同一套网络权重进行学习;使用基于变分自动编码器的注意力机制,增强机器人对任务相关区域的关注度;计算联合效应值;使用分解器为每个机器人生成独立的学习样本;学习样本被用来训练多智能体系统中的神经网络。本申请将可解释性模型与分解器模型进行有机结合,提升模型的整体性能;通过分解器解决可解释方法在智能体数量较多的复杂环境下性能受限的问题。
技术关键词
变分自动编码器
集群调度方法
注意力机制
仓储机器人
分解器
多智能体系统
混合网络
神经网络架构
门控循环单元
多层感知器
团队
训练智能体
ReLU函数
样本
后机器人
超参数
系统为您推荐了相关专利信息
监测点
实时监测方法
三维形变监测
门控循环网络
实时监测系统
迁移学习模型
特征提取器
样本
权重分配机制
注意力机制
故障预测诊断方法
混合诊断模型
小波包能量熵
故障记录数据
门控循环单元
实体识别方法
多头注意力机制
LSTM神经网络
双通道神经网络
文本特征向量
服务系统
样本
自动化设计方法
孪生神经网络
拓扑图