摘要
本发明公开了一种消费金融信贷中介处理方法以及装置。涉及数据信息基于结构化数据库进行数据存储,使用结构化查询语言(Structured Query Language,SQL)和Python语言进行数据处理、数据分析、特征衍生、特征筛选和模型训练等操作。模型算法基于LightGBM(轻量级的、快速的、高性能的,分布式的基于决策树梯度提升工具),特征选择参考指标包括IV值(InfromationValue,可用来表示变量的预测能力)、缺失率(缺失样本占总样本的占比)、最大单一值占比(具有同一数值的样本占总样本比例的最大值)以及PSI(Population Stability Index,用于评估两个数据集或时间点之间的分布变化)等。
技术关键词
样本
金融
机器学习模型训练
结构化查询语言
存储器
客户征信
计算机可执行指令
风险
模型算法
指标
特征选择
归属地
计算机设备
数据存储
超参数
处理单元
证件
高性能