摘要
本发明涉及一种基于嵌入式强化学习的调度与维护优化方法及系统,方法包括以下步骤:采集生产运行过程与机器维护历史数据;构建调度与维护智能体和特征选择智能体;构建调度与维护Markov决策过程;构建特征选择Markov决策过程;特征选择智能体与特征选择Markov决策过程交互并学习最优状态特征选择策略;调度与维护智能体与调度与维护Markov决策过程交互并学习最优调度与维护优化策略;部署并执行部署并执行特征选择智能体和调度与维护智能体进行调度与维护优化。系统包括调度与维护控制器、调度与维护智能体、特征选择智能体。解决了生产中订单动态到达环境下难以精准表征动态环境导致的性能不足的问题,实现调度与维护的联合优化并提升设备可靠度和降低生产成本。
技术关键词
特征选择
决策
深度神经网络
贪心策略
掩码矩阵
神经网络参数
定义
历史运行数据
设备运行状态
生成动作
控制器
误差
订单
算法
动态
信号
系统为您推荐了相关专利信息
深度神经网络模型
深度强化学习
历史运行数据
电力系统模型
训练深度神经网络
无人机集群对抗
决策优化方法
深度强化神经网络
策略
算法
启发式方法
信息数据处理终端
策略
视野
搜索模块
齿轮减速电机
虚拟仿真技术
零件
部件修复方法
虚拟仿真方法