摘要
本发明涉及一种征信变量组合挖掘方法及系统,该方法包括:获取客户的历史征信数据,提取征信基础变量;利用机器学习算法对征信基础变量进行组合衍生,通过预先构建的计算框架计算征信变量组合的价值;计算征信基础变量及其构成的征信变量组合的KS值,计算组合后增益;剔除相关性大于预设相关性阈值的组合,基于组合后增益和相关性,选取目标征信变量组合,最终得到独立高价值征信变量组合。本发明通过机器学习算法和数学方法对征信基础变量进行组合衍生,生成新的征信变量组合,并计算这些组合的价值,从而深度挖掘了征信数据的潜在价值。通过计算征信变量组合的KS值,并评估组合后增益,优化了征信数据对好坏客户的区分度。
技术关键词
变量
挖掘方法
征信数据
机器学习算法
基础
客户
框架
高增益
挖掘系统
存储器
成分分析
程序
处理器
可读存储介质
模块
计算机
样本
电子设备
指令
聚类