一种基于少数类簇加权的过采样算法

正文

推荐专利

一种基于少数类簇加权的过采样算法

申请号：CN202411059543

申请日期：2024-08-04

公开号：CN119272079A

公开日期：2025-01-07

类型：发明专利

摘要

本发明涉及一种基于少数类簇加权的过采样算法。本发明首先对原始数据集中的所有少数类样本进行k‑means聚类，形成多个少数类簇，将少数类样本划为安全点，边界点和噪声点，并将噪声点删除。其次结合采样率计算出每个少数类簇需要合成的少数类样本的数量，然后根据边界点样本和安全点样本的分布情况，分别以不同的方法为边界点样本和安全点样本分布权重。最后根据每个少数类样本点的权重使用改进后的SMOTE算法生成少数类样本，使数据集达到平衡状态；利用UCI数据库中的6组标准版公开数据集进行测试，验证了该方法可以有效降低少数类样本的重叠率，提高分类器对少数类样本的分类精度。本发明更准确分析了数据集原始分布情况，降低了样本间的冗余性，从而提高了分类器的性能。

技术关键词

样本采样率算法生成方式密度数据分布噪声连线分类器冗余点分配聚类因子代表精度

系统为您推荐了相关专利信息

一种基于综合稳定系数的劲性骨架拱桥主拱圈施工方案评价方法

拱桥主拱圈评价方法劲性骨架情景遗传算法

基于改进粒子群优化前馈模型的化学加氨串级控制方法

省煤器除氧器粒子群算法入口极值

一种基于多传感器融合和多模态大模型的道路病害检测系统及方法

道路病害检测可见光相机实时数据处理多模态三维形状信息

一种基于多模态特征提取与融合的恶意代码识别方法

恶意代码识别方法可视化特征多模态统计特征多头注意力机制

一种小目标检测的方法、装置、计算机存储介质及终端

计算机存储介质图像切割单元 YOLO算法网络

一种基于少数类簇加权的过采样算法

站点导航

APP 下载