摘要
本发明提出了一种基于分解式多目标强化学习的作业车间调度方法,解决针对复杂调度环境中多目标优化难以平衡、策略不稳定及优化效率低下的问题。该方法通过动态调整权重配置,利用双曲正切模型预测候选权重的目标值,并结合正则化减少模型复杂度,引入综合评价指标筛选解集,实现特征的自适应学习和策略的稳定更新。通过优化权重选择和策略更新机制,能够高效地平衡多个冲突目标,提高调度决策的效率和准确性,降低能耗,提升生产效率。本发明在工业自动化和智能制造过程中,能够有效解决多目标作业车间调度问题,为生产优化提供技术支持。
技术关键词
作业车间调度方法
强化学习模型
综合评价指标
参数
梯度下降法
策略更新
度量
数据采集模块
能耗
更新方法
动态更新
信息熵
定义
决策
因子
复杂度