摘要
本发明涉及一种分布式阻塞多产品间歇过程生产调度方法,属于生产调度技术领域,该方法包括以下步骤:建立以最小化最大完工时间为目标的分布式阻塞多产品间歇过程生产调度模型;采用基于种群多样性的强化学习算法求解模型以获得调度方案,其中,在求解过程中,通过计算种群中个体之间的加工序列距离确定多样性指标距离异质比例,每一个体代表一个调度解,为工厂对应的加工序列的集合,基于多样性指标距离异质比例更新智能体的状态,并确定对应的奖励。与现有技术相比,本发明提出一种新的多样性指标,可以衡量种群的多样性变化,从而控制算法探索和开发之间的平衡,有助于优化算法结构设计,提高算法的搜索效率,可以快速获得较优调度方案。
技术关键词
订单
序列
强化学习算法
异质
指标
一台设备
启发式规则
贪婪策略
代表
计算方法
定义
索引
变量
参数