摘要
本发明属于异常数据清洗领域,公开了一种基于多模型融合的异常数据清洗方法及系统,该异常数据清洗方法包括以下步骤:对待清洗数据进行预处理;识别离散异常数据;识别堆积异常数据;建立随机森林模型和长短期神经网络模型;基于人工鱼群算法将随机森林模型和长短期神经网络模型组合,得到RF‑LSTM预测模型;将含缺值数据输入RF‑LSTM预测模型,输出预测结果填充至数据集,完成异常数据清洗,结合孤立森林算法和聚类算法,能够有效地识别出具有离散分布和聚集分布的异常数据,拓宽了异常数据识别的范围,提高了识别的准确性和全面性,利用RF‑LSTM预测模型对缺失值进行预测和填充,可以确保数据集的完整性和一致性,从而进一步提高业务决策的准确性。
技术关键词
异常数据
随机森林模型
清洗方法
多模型
神经网络模型
孤立森林算法
人工鱼群算法
长短期记忆网络
超参数
邻域
聚类算法
识别模块
核心
训练集
组合模块
清洗系统
标记
优化器
框架
系统为您推荐了相关专利信息
复用方法
SiPM阵列
PET探测器
深度学习模型
信号线
节点
天然气
仿真模型
神经网络模型
仿真预测方法
储能电站
热管理控制方法
深度神经网络
时间序列预测模型
卷积神经网络模型