摘要
本发明提出一种需求扰动下的混合流水车间动态调度优化方法。首先,构建马尔科夫决策过程(MDP)模型,其状态集合由工件状态和机器状态两部分构成,并设计了二维动作集合及特定奖励函数,旨在引导生产按期高效交付。然后,采用双向长短时记忆网络(Bi‑LSTM)构建决策智能体的状态特征提取网络,处理时序依赖性。之后,训练过程中,使用近端策略优化算法(PPO)结合基于势函数的奖励塑形方法,提升训练稳定性和效率。最后,在调度过程中,持续监测需求扰动,使用训练后的智能体实时调整,确保生产顺畅高效。此方法显著提升生产效率,优化资源利用,增强生产灵活性,降低生产成本,提高产品质量和客户满意度,实现生产过程智能化管理,增强企业市场竞争力和适应能力。
技术关键词
动态调度优化方法
流水车间
特征提取网络
决策
工件
监测需求
策略
塑形方法
阶段
算法
参数
时序
客户
数据
企业
序列
资源