一种基于自然最近邻的混合采样算法

正文

推荐专利

一种基于自然最近邻的混合采样算法

申请号：CN202511147832

申请日期：2025-08-15

公开号：CN121030492A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及一种基于自然最近邻的混合采样算法。该算法结合样本的空间分布密度、自然最近邻关系以及相似度评估机制，实现对噪声样本的识别与剔除、多数类样本的欠采样处理以及少数类样本的有针对性过采样，从而改善不平衡数据集的学习效果。该算法在欠采样时删除掉对分类帮助不大的样本，在合成新样本时考虑到每个样本之间的信息差异的情况会为每个少数类低密度样本分配权重，权重越高的样本越优先参与合成新的样本，即可以保证新生成的样本不会和原本数据集中的某些样本相似或重叠，又可以避免产生新的噪声样本，既可以保证整体数据集分布较为均匀且还可以有助于数据分类。

技术关键词

噪声样本低密度高密度相似性度量方法算法数据分类矩阵邻域权重机制决策代表概念特征值线段比率

系统为您推荐了相关专利信息

一种基于大数据分析的调度任务方法和系统

多尺度注意力机制资源形式化验证方法节点决策

基于无人机的草原火点检测与定位方法

无人机定位方法实景三维模型双向特征金字塔坐标系

一种基于多模态与向量数据库的多目标行人重识别系统

行人重识别系统轨迹摄像装置模糊阈值图像增强

一种电网状态预测方法、系统及相关设备

状态预测方法卷积神经网络模型支路编码方程

一种分布式电源并网的优化方法及装置

分布式电源配电网模型粒子群算法配网接入节点

一种基于自然最近邻的混合采样算法

站点导航

APP 下载