摘要
本发明涉及制造系统优化技术领域,具体涉及一种多阶段制造系统联合优化方法,该方法包括建立机器退化模型与加工质量模型;建立缓存区的存量模型;并建立在制品质量状态检验模型;根据退化模型与加工质量模型,以及存量模型和在制品质量状态检验模型,构建状态空间,以及制造系统的奖励;根据优化目标构建动作空间;根据状态空间、动作空间以及奖励,基于DDPG算法,通过智能体与制造系统交互训练,直到训练平稳后,得到最优奖励以及动作。本发明使用深度强化学习DDPG算法对制造系统进行联合优化,得到生产过程中奖励值最高的对应策略,并与其他常见策略进行对比分析,验证该方法的优越性。
技术关键词
联合优化方法
概率分布函数
退化模型
概率密度函数
制品
多阶段
不合格品
系统优化技术
决策
深度强化学习
基础
算法
代表
策略
负荷
进料
模块
模式
系统为您推荐了相关专利信息
文本识别模型
字符
语音活动检测系统
混合语音识别
标点预测方法
联合优化方法
功率控制
李雅普诺夫优化
变量
时延
无人驾驶交通工具
路径搜索方法
特征点
路径搜索算法
概率分布函数