摘要
本发明提供了一种基于客户代理多投标的深度强化学习作业车间调度方法,解决现有技术中无法对多代理作业车间进行调度的问题,包括:建模多代理作业车间调度问题,并获取客户代理对应的客户代理智能体、作业车间对应的作业车间代理智能体、以及获取作业车间的调度状态;获取各工序节点的特征表示,以及输出每轮次招投标中参与投标的工序集合;获取各工序节点的特征表示,输出定标决策顺序;作业车间代理智能体收集所有客户代理的投标工序集合进行定标决策,不断重复招标过程,直至生成最终调度方案的。本发明在能够保护好各客户代理私有偏好的前提下,实现多个具有个性化目标的代理共同参与调度决策,以形成各方均可接受的调度方案。
技术关键词
作业车间调度方法
客户
特征提取网络
深度强化学习
策略
决策
节点特征
梯度算法
工件
编码器
神经网络结构
表达式
邻域
训练算法