摘要
本发明涉及数据挖掘技术领域,揭露了一种基于三段式漏斗型的特征组合筛选方法、设备及介质,包括:根据组合算子对原始风控特征进行特征组合,对组合后的特征进行分布式存储,计算分布式存储后的每个组合特征与业务目标之间的相关系数值,根据相关系数值对组合特征进行第一漏斗筛选;对构建的业务树模型的树结构进行冻结,利用筛选后的每个组合特征逐一对冻结后的业务树模型进行分裂;计算分裂后的业务树模型的优化指标,根据优化指标对筛选后的每个组合特征进行第二漏斗筛选;利用业务树模型计算第二筛选后的每个组合特征的重要性值,根据重要性值进行第三漏斗筛选,得到符合业务目标的目标特征组合。本发明可以提高特征筛选时的效率。
技术关键词
特征组合筛选方法
风控特征
连续型组合
连续特征
离散特征
逾期账单
指标
数据挖掘技术
数值
场景
特征值
曲线
生成特征
反欺诈
电子设备
处理器通信
可读存储介质
存储器