摘要
本发明公开一种基于多目标图强化学习的多异构装备配置方法及装置,该方法将装备配置问题通过建模转换成多目标组合优化问题模型,并设置若干评估指标;通过堆叠若干异构图注意力层,构建增强异构图注意力网络;将全连接深度神经网络作为解码器,并通过多步非自回归策略生成装备配置方案;将偏好向量代入解码过程中,对单个基于偏好条件的神经网络模型进行训练,实现偏好多目标优化;通过设定强化学习算法对所述多目标组合优化问题模型进行训练;将装备参数信息输入训练好的多目标组合优化问题模型,输出多异构装备配置优化方案。本发明能够有效地处理具有不同规模和分布的配置问题,提高运算效率,降低资源消耗。
技术关键词
异构
装备
注意力
强化学习算法
解码器
表达式
深度神经网络
预编码模块
神经网络模型
节点
配置装置
转换单元
冗余度
指标
处理单元
策略
矩阵