一种基于安全梯度分布的合成过采样方法及系统

正文

推荐专利

申请号：CN202411523296

申请日期：2024-10-30

公开号：CN119046740B

公开日期：2025-05-09

类型：发明专利

摘要

本发明提出了一种基于安全梯度分布的合成过采样方法及系统，属于人工智能/数据挖掘技术的不平衡分类领域；本发明通过交叉熵梯度确定样本的梯度贡献，将梯度贡献分成多个区间并设置安全梯度阈值，将梯度贡献小于安全梯度阈值的区间作为安全梯度区间；按照梯度贡献将少数类样本分配到不同的梯度区间并进行安全梯度分布计算；以安全梯度区间内的样本作为根样本，以根样本的梯度右近邻作为辅助样本，基于安全梯度分布近似策略确定样本合成数量；采用线性插值方法为每个安全梯度区间合成伪样本，实现样本的合成过采样。本发明避免了噪声样本的误差积累且不依赖空间特征，能够保证数据集的类别平衡，提高了分类模型的性能。

技术关键词

过采样方法线性插值方法信用卡数据挖掘技术噪声样本采样系统处理器程序策略可读存储介质存储器电子设备模块精度计算机误差

系统为您推荐了相关专利信息

一种面向大规模冲压生产线的数字孪生仿真与优化方法

冲压生产线数字孪生数字化建模技术优化决策技术故障指示器

抗体结构预测方法、装置、设备、存储介质和程序产品

抗体结构预测方法神经网络模型分子坐标

基于生成式协同学习的无监督黑盒成员推理攻击方法及系统

置信度阈值累积分布函数标签大语言模型编码器

基于多视图与点云BEV特征融合的三维目标检测方法

视觉图像线性变换矩阵多传感器融合激光雷达点云数据

一种潜在客户分析挖掘方法及系统

分析挖掘方法矩阵客户训练集数据挖掘技术

一种基于安全梯度分布的合成过采样方法及系统

站点导航

APP 下载