摘要
本发明涉及数据清洗领域,具体地说,涉及一种多源风控数据清洗处理方法。其包括以下步骤:S1、收集不同源的风控数据;S2、通过对多源风控数据进行拆分和标签提取,基于数据归类算法进行多源风控数据的归类;S3、基于归类后的多源风控数据采用数据处理算法对数据进行预处理;S4、对预处理后的数据进行异常值进行检测、处理和转换完成数据清洗;S5、随机抽取数据样本,并对数据样本进行数据验证。通过随机种子拆分算法对数据进行精确划分,同时,结合数据去重算法消除冗余记录,数据补全算法填充缺失信息,以及异常值检测与处理算法识别并调整极端数据点,确保了数据集在用于风险模型构建时的纯净度和可信度。
技术关键词
归类算法
数据处理算法
样本
去重算法
拆分算法
数据标签
变换算法
数据验证
完整性验证算法
统计算法
转换算法
文本
转化算法
唯一性
种子
度量
系统为您推荐了相关专利信息
X射线探测器
像素点
图像校正方法
多项式
图像生成装置
图像检测模型
泛化方法
分类器
检测损失
特征提取器
中医体质辨识
图像采集模块
LAB颜色空间
答题
数据