摘要
本申请提供一种基于强化学习的加工装配混合柔性作业车间调度方法,所述方法包括:根据柔性作业车间和柔性装配车间的混合调度实例生成训练集;所述训练集包括工序的前置工序信息、可选机器信息以及加工/装配时间信息;基于马尔可夫决策和所述训练集构建强化学习模型;所述强化学习模型包括智能体、环境状态表示模块、动作选择模块、状态转移模块、收益模块和策略模块;通过双编码器和解码器参数化所述强化学习模型中的工序选择动作策略和机器选择动作策略;采用基于近端策略优化的multi‑PPO深度强化学习框架学习所述工序选择动作策略和机器选择动作策略,以生成生产调度方案,解决现有作业车间调度方法不能满足复杂工艺环境的问题。
技术关键词
动作策略
强化学习模型
柔性作业车间
双编码器
作业车间调度方法
训练集
深度强化学习
模块
解码器
工件
决策
框架
网络
参数
算法
系统为您推荐了相关专利信息
强化学习模型
模型训练模块
控制智能体
强化学习方法
无监督
移动工业机器人
深度强化学习模型
接入点
信道
网络
深度Q网络
DQN算法
测试方法
深度神经网络
页面