摘要
本发明公开了基于数据及动态特征优化与Bagging集成的信贷风险预测方法,包括如下步骤:S1:获取初始数据集,进行数据预处理,并通过ATGA算法平衡数据集,降低数据噪声;S2:以LightGBM为代理模型,计算所有特征的重要性得分,逐步地筛选关键特征,并通过动态阈值算法,根据数据分布自适应调整特征筛选标准,逐步筛选出特征子集,并将筛选出的特征输入到后续模型中;S3:使用Bagging集成算法构建TabPFN模型,并引入动态权重分配机制,根据样本特征自适应调整各基模型的权重,最终通过TabPFN模型实现信贷风险预测。本发明在数据集优化,特征筛选优化,模型性能优化三个方面综合性地对信贷风险预测的过程进行了优化,使得准确率、回报率等指标有所提高。
技术关键词
LightGBM模型
动态
权重分配机制
遗传算法优化
数据分布
集成算法
优化集成模型
优化组合方法
数据噪声
阈值算法
特征筛选方法
训练分类模型
噪声样本
变量
集成方法
特征选择