摘要
本申请公开了一种基于PCA和孤立森林算法的异常数据筛查方法及系统,所述方法包括:步骤1:收集分布式光伏电站的运行数据,并进行预处理;步骤2:从预处理后的数据中提取与光伏发电量异常检测相关的特征,得到特征数据;步骤3:结合每个特征的信息熵确定PCA的主成分,从而对提取的特征数据进行降维;步骤4:结合预训练的孤立森林模型和自编码器重构模型对降维后的数据进行异常检测,得到每个数据的异常分数;步骤5:根据异常分数和预设第一阈值确定异常数据。本申请能够处理高维分布式光伏发电站的运行数据,并充分捕捉数据的非线性特征和动态变化,进而提高了复杂数据模式下光伏发电异常数据筛查的效率和准确性。
技术关键词
筛查方法
异常数据
分布式光伏电站
重构模型
森林模型
光伏发电量
信息熵
重构误差
孤立森林算法
分布式光伏发电站
编码器
协方差矩阵
特征值
非线性特征
筛查系统
特征提取模块
峰谷电价