摘要
本发明涉及数据处理领域,特别是涉及一种数据清洗方法。包括:对原始数据集进行初步预处理,得到数据集,采用改进的多维空间异常检测方法计算局部异常因子识别数据集中的异常数据点,并对异常数据点进行剔除;异常数据点剔除后,采用非线性加权相关系数填补法填补缺失值,得到填补后的缺失值;在填补缺失值后,对数据集进行格式化和统一处理。解决了传统的异常检测方法通常采用固定邻居数来判断数据点的异常性,无法灵活适应数据的局部密度变化,容易导致误检或漏检,从而影响检测结果的准确性;现有的相似度计算方法主要依赖简单的欧几里得距离或线性核函数,未能有效捕捉数据点之间的非线性关系的技术问题。
技术关键词
数据清洗方法
加权相关系数
异常数据点
异常检测方法
非线性
邻居
因子
度计算方法
动态
格式化
特征值
索引
变量
机制
密度
参数
系统为您推荐了相关专利信息
环境光
参数优化算法
神经网络模型
光强
藻类光合作用
粒子群优化方法
装备维修保障
资源优化配置
仿真模型
决策
飞机姿态控制方法
飞机飞行状态
监测传感器
设备故障监测
气流传感器
监督学习模型
变分自动编码器
检测农作物叶片
无损检测方法
框架
雅可比矩阵
神经网络模型
关节
运动学映射关系
末端执行器