一种最优过采样和邻域修正的不平衡数据分类方法

正文

推荐专利

申请号：CN202411461437

申请日期：2024-10-18

公开号：CN119046689A

公开日期：2024-11-29

类型：发明专利

摘要

本发明公开了一种最优过采样和邻域修正的不平衡数据分类方法，属于不平衡数据分类领域，该方法包括基于密度峰值选取少数类子集中的基准样本，将基准样本的近邻样本作为人工样本；生成合成样本，并将合成样本加入少数类子集，根据更新后的少数类子集和多数类子集，得到平衡训练数据集；利用平衡训练数据集训练分类器；利用训练完成的分类器对测试样本集进行分类，得到各样本的分类结果，并根据各样本的分类结果获取确定样本集和不确定样本集；对不确定样本集中的不确定样本，基于校准矩阵对分类结果进行校准，根据校准后的分类概率确定不确定样本的分类结果。本发明解决了现有过采样方法在处理不平衡数据集时性能低的问题。

技术关键词

样本数据分类方法校准基准邻域训练分类器训练集密度 K均值聚类算法矩阵过采样方法表达式 K近邻框架指标标记定义

系统为您推荐了相关专利信息

基于任务自适应的目标检测模型鲁棒性提升方法

鲁棒性样本生成方法随机梯度下降电子设备存储器

一种基于智能驾驶的点云数据消噪方法及系统

消噪方法三维点云数据组合算法 DBSCAN算法灰狼算法

一种放大器芯片封装后修调的电路系统及方法

放大器芯片电路系统整形电路指令管脚

数据预测方法、预测大模型训练方法及相关装置

字符模型训练方法数据预测方法样本文本预测方法

一种基于探索性仿真分析的体系贡献率评估方法

贡献率仿真模型仿真分析效能观点

一种最优过采样和邻域修正的不平衡数据分类方法

站点导航

APP 下载