摘要
本发明公开了一种基于机器学习的工业设备运行数据清洗方法、装置、设备以及计算机可读介质,本申请获取工业设备运行的原始数据,对原始数据进行预处理;构建孤立森林算法模型,将预处理后的原始数据输入孤立森林算法模型进行异常检测,标记出正常数据点和异常数据点,生成包含正常数据点的正常数据集和包含异常数据点的异常数据集;基于正常数据集训练随机森林回归模型,将异常数据集输入到训练后的随机森林回归模型,得到异常数据点的预测值;对异常数据点的值进行修正,输出修正后的数据集;将修正后的数据集重新输入孤立森林算法模型,以验证修正后的数据集中是否存在新的异常数据点。
技术关键词
工业设备运行数据
孤立森林算法
异常数据点
清洗方法
计算机程序指令
随机森林
存储计算机程序
数据获取模块
数据处理模块
特征值
数据验证
节点
处理器
标记
介质
系统为您推荐了相关专利信息
异常信号
滑动时间窗口
识别方法
孤立森林算法
异常数据
电网分析方法
电网运行参数
深度学习模型
等效电路模型
振荡特征