摘要
本发明公开了一种风电机组SCADA数据多级协同清洗方法,步骤如下:读取风电场SCADA系统导出的原始数据文件;对数据进行预处理与特征衍生;依次使用LOF算法检测局部密度,使用DBSCAN算法检测空间聚类,利用统计分布检测动态阈值;形成多级协同检测策略;汇总所有检测结果,生成最终的异常标记列;原始数据全集被保留,仅通过该标记列区分异常点与正常点;通过机器学习模型在清洗前后数据集上的性能表现来定量评估清洗效果。本发明融合了LOF、DBSCAN和动态阈值三种不同原理的检测方法,构成了一个多级防御网络,能够有效识别“孤立点”、“集群边缘点”和“统计离群点”等多种异常模式,大大提高了检测的召回率和精确度。
技术关键词
风电场SCADA系统
DBSCAN算法
清洗方法
风电机组
LOF算法
机器学习模型
DBSCAN模型
数据
标记
离群点
校正
功率值
扇区
密度
算术平均值
动态
聚类
表达式
预测误差
系统为您推荐了相关专利信息
数据访问
混合模块
关联预测方法
序列
预测数据对象
火灾探测报警器
异常信号
Wasserstein距离度量
分布式传感器网络
异常数据
电路板
分层散热结构
风能转换效率
复合陶瓷材料
功率半导体器件