摘要
本发明公开了一种基于样本重要性的不平衡数据过采样方法,其特征在于,所述方法包括确定原始数据集的流程、确定少数样本集中需要进行过采样的样本的流程、合成新样本插入到需要进行过采样的样本所属样本集的流程。本发明能够降低噪声数据的影响,提高少数类样本数据的质量,降低模型的过拟合现象。
技术关键词
样本
过采样方法
神经网络模型
标签
K近邻算法
噪声数据
关系
插值法
系统为您推荐了相关专利信息
分类识别模型
岩性快速识别方法
岩屑样品
岩性识别
光谱特征信息
自动作文评分方法
标签生成技术
对抗性
作文评分系统
预训练模型