基于多目标强化学习的拆解线平衡优化方法、系统及介质

正文

推荐专利

申请号：CN202510976103

申请日期：2025-07-16

公开号：CN120494441B

公开日期：2025-10-21

类型：发明专利

摘要

本申请涉及数据处理技术预测领域，公开了基于多目标强化学习的拆解线平衡优化方法、系统及介质，方法：S1、获取输入数据并预处理；S2、构建状态空间、动作空间和目标函数，部署训练环境；S3、训练多目标强化学习模型：通过MO‑DQN算法引入偏好向量动态调整目标权重，根据S1获取的拆解数据，计算目标函数，优化S2中的多个目标，结合ε‑贪婪策略和NSGA‑II算法选择动作策略；S4、将训练好的模型生成的最优策略应用于拆解线中的任务分配。通过引入偏好向量，根据任务的具体需求动态调整目标权重，不仅能有效处理目标之间的冲突，还能根据不同情境的变化自动调整优化策略，提升拆解任务中的任务调度与资源分配效率。

技术关键词

强化学习模型 DQN算法动作策略平衡优化方法贪婪策略深度Q网络机器人工作站工位任务调度资源分配更新网络参数能耗动态数据处理技术理论

基于多目标强化学习的拆解线平衡优化方法、系统及介质

站点导航

APP 下载