摘要
一种基于强化学习的机械装备维修和备件决策方法、系统、介质及设备,方法中,采用主成分分析法对机械装备连续监测数据降噪后,基于维纳过程拟合退化曲线,并确定失效阈值;基于设备劣化和库存的离散状态构建状态空间,基于维修动作和订购时机构建动作空间;基于维修成本与备件管理成本建立成本函数,并计算期望奖励值;采用多智能体DDQN强化学习算法以期望奖励值最大为优化目标,获得机械装备劣化的离散状态下的最佳维护和备件管理行为。
技术关键词
备件管理
决策方法
连续监测数据
强化学习算法
主成分分析法
强化学习网络
表达式
优化系统维护
Softmax函数
装备
矩阵
机械
累积分布函数
周期
计算机存储介质
梯度下降法
批量数据
转速传感器
系统为您推荐了相关专利信息
资源调控方法
调控策略
强化学习算法
深度学习算法
长短期记忆网络
节能驾驶策略
深度强化学习算法
SAC算法
能量管理策略
多车道场景
多模态网络
审核策略
机器学习模型
跨模态检索技术
数据
软件缺陷模式
能力评估方法
神经网络算法
传感器
聚类分析法
基因测序芯片
温度控制方法
强化学习算法
半导体制冷器
温度控制系统