摘要
本发明公开了一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,涉及车间调度技术领域。本发明根据人员学习效应下的柔性装配作业车间的绿色动态多目标调度要求,建立多目标性双智能体规划模型,结合机器和人员双资源约束下,基于双层深度强化学习框架方法解决该模型的动态多目标调度问题;根据车间仿真环境设计了状态空间和动作空间,并结合即时奖励和回合奖励的奖励函数;智能体与调度环境交互,在调度点获得较优调度规则;通过上述方法,本发明提高制造企业的决策效率,能够自适应地迅速产生较优解,有效减少因延迟时间造成的损失,降低能源的消耗,同时具有一定的泛化性和稳定性。
技术关键词
决策
深度强化学习
能耗
效应
柔性
策略
动态
网络
高层次
工件特征
算法框架
车间调度技术
作业车间调度
指标
环境状态信息
一台设备
参数
框架方法
系统为您推荐了相关专利信息
网络
信息处理方法
计算机可读指令
深度确定性策略梯度
非瞬时性计算机可读存储介质
生长预测模型
水文参数
长短期记忆网络
氧量
决策支持系统
解析技术
非易失性存储介质
兼容问题
决策树模型
支持灰度发布
电池寿命模型
评估预测方法
动力系统
LSTM模型
寿命预测模型建立
摩擦电传感器
触觉传感器
水果采摘系统
双模态
采摘机器人