摘要
本发明公开了一种数据过采样方法、系统、电子设备和存储介质,涉及数据处理技术领域,方法包括:基于不均衡数据集中的样本点的每个特征值与结果之间的Spearman相关系数,对欧式距离计算公式进行修改,确定修改后的欧式距离计算公式;利用修改后的欧式距离计算公式计算得到的距离,对所述不均衡数据集中的预设少数类样本点进行过采样处理。本发明考虑了每个特征与结果之间的Spearman相关系数,从而为不同的特征赋予不同的权重,利用本发明对不均衡数据集进行过采样处理,能够提高机器学习模型的训练效果。
技术关键词
样本
过采样方法
采样系统
特征值
电子设备
可读存储介质
机器学习模型
数据处理技术
模块
处理器
存储器
计算机
系统为您推荐了相关专利信息
虚拟对象
图形用户界面
游戏场景
交互控制方法
关系
图像管理方法
模型训练方法
序列
注意力参数
融合特征
网络主控设备
按键
仿真模型
状态监测系统
检测点