摘要
本发明公开的基于过采样分类的客户流失预测方法,包括获取客户流失数据集并预处理,数据聚类,选择并标记出少数类样本占主导地位的簇并计算采样权值,对采样权值大于0的簇计算簇内样本的隶属度并进行空间划分,根据区域划分结果选择样本执行线性插值过采样生成平衡数据集,训练分类器并择优构建最终的客户流失预测模型,输出客户流失预测类别及概率。本发明通过聚类和隶属度区域划分的过采样方法进行客户流失数据集的平衡化处理,以选取最安全的样本进行合成,有效降低引入噪声和模糊边界的风险,通过生成高质量的少数类样本平衡了数据类别分布,进而提升了对少数类样本的识别性能,提高了客户流失预测的准确性。
技术关键词
客户流失预测方法
客户流失预测模型
客户流失数据
训练分类器
标记
预测类别
网格搜索方法
模糊边界
噪声样本
轮廓系数
采样方法
矩阵
聚类
正确率
密度
系统为您推荐了相关专利信息
废旧锂电池材料
萃取设备
磷酸铁
指数
高纯碳酸锂
养殖数据采集
轨道巡检机器人
温度采集组件
耳机主体
多通道旋转接头