摘要
本发明涉及一种多智能体协同的半导体批处理区调度方法,该方法融合对抗学习与多智能体协作机制,构建组批智能体与批次指派智能体,实现批次组合与任务分派的联合优化。引入门控循环单元网络提取车间运行过程中的动态特征,增强调度策略对时序信息的感知与环境适应能力。通过对抗训练生成真实与虚拟经验样本进行预训练,扩展训练数据并提升策略收敛速度。进一步引入关系校正网络建模经验之间的内在关联结构,结合相对熵优化机制提升经验质量和策略更新效率。解决了晶圆加工系统调度通过传统的强化学习方法常常难以满足快速响应和高效调度的问题,本发明可快速、准确生成调度决策,有效缩短晶圆制造过程中的总生产周期,具备较高的工程应用价值。
技术关键词
批处理环境
指派
决策
动态调度信息
生成对抗网络
晶圆
样本
多智能体协同
深度神经网络
半导体
车间
关系
模型参数更新方法
深度强化学习
模块
门控循环单元网络
机器状态数据
策略
系统为您推荐了相关专利信息
支气管肺泡灌洗液
转录组测序数据
差异表达基因
预后预测系统
特征选择算法
双向长短期记忆
服务特征
资源特征
服务调用拓扑
融合特征
强化学习系统
数据存储模块
数据输入模块
结构单元
数据嵌入
多模态数据融合
梯度提升决策树
图谱
长短期记忆网络
电子设备