摘要
本发明提供的过采样多聚类融合的数据预测方法、装置、设备及介质,涉及数据预测领域。本发明通过获取原始数据集,进行预处理后,分为少数类数据和多数类数据;对少数类数据分别采用不同的聚类算法进行聚类,并将生成的聚类中心数据添加到少数类数据中;对添加聚类中心后的少数类数据进行IF‑SNNDPC聚类,并计算每个子簇的过采样数量;在每个子簇中,计算随机选择的两个非聚类中心的点与聚类中心之间的质心,并将质心作为新样本加入少数类数据中,直至满足对应子簇所需的样本数量,得到最终的少数类数据;将最终的少数类数据与多数类数据一起输入预先训练好的XGBoost模型,得到预测的数据。本发明能增加少数类别的样本数量,解决样本数据类别不平衡的问题。
技术关键词
数据预测方法
样本
计算机可读指令
算法
成绩
聚类
邻居
数据预测装置
可读存储介质
交叉验证法
学生
度量
密度
处理器
存储器
训练集
表达式
系统为您推荐了相关专利信息
保护系统
高清摄像头
图像处理算法
控制单元
执行图像处理
图像生成方法
人脸
双线性插值方法
镜像
注意力机制
储能装置
经济调度模型
粒子群算法
协调优化方法
计算机执行指令