摘要
本申请涉及数据处理技术领域,具体涉及一种数据清洗方法、系统及数据中心平台,该方法包括:获取不同用户的信息数据集;计算所述信息数据集中每个类别的参数关联度;确定所述任意两个用户的相对差异度;对所有用户进行聚类;构建每个聚类簇中各种参数对应的参数矩阵;确定所述参数矩阵内每列的异常度,对所有聚类簇中各种参数对应的所述参数矩阵内的数据进行清洗,得到不同用户清洗后的信息数据集。本申请能够更加精确的识别异常数据,提高了数据清洗的质量,提升对数据进行挖掘分析的准确度。
技术关键词
数据清洗方法
参数
数据中心平台
矩阵
多准则决策分析
数据清洗系统
识别异常数据
元素
序列
数据处理技术
处理器
度量
聚类
存储器
算法
系统为您推荐了相关专利信息
影像数据处理系统
图文
图像特征参数
图像识别模型
图像噪声水平
模压设备
玻璃材料
珀尔帖元件
性能预测模型
控制系统
预测模型训练方法
样本
参数优化模型
强化学习方法
视角