一种基于自然最近邻的混合采样算法

AITNT
正文
推荐专利
一种基于自然最近邻的混合采样算法
申请号:CN202511147832
申请日期:2025-08-15
公开号:CN121030492A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及一种基于自然最近邻的混合采样算法。该算法结合样本的空间分布密度、自然最近邻关系以及相似度评估机制,实现对噪声样本的识别与剔除、多数类样本的欠采样处理以及少数类样本的有针对性过采样,从而改善不平衡数据集的学习效果。该算法在欠采样时删除掉对分类帮助不大的样本,在合成新样本时考虑到每个样本之间的信息差异的情况会为每个少数类低密度样本分配权重,权重越高的样本越优先参与合成新的样本,即可以保证新生成的样本不会和原本数据集中的某些样本相似或重叠,又可以避免产生新的噪声样本,既可以保证整体数据集分布较为均匀且还可以有助于数据分类。
技术关键词
噪声样本 低密度 高密度 相似性度量方法 算法 数据分类 矩阵 邻域 权重机制 决策 代表 概念 特征值 线段 比率
系统为您推荐了相关专利信息
1
一种基于大数据分析的调度任务方法和系统
多尺度注意力机制 资源 形式化验证方法 节点 决策
2
基于无人机的草原火点检测与定位方法
无人机 定位方法 实景三维模型 双向特征金字塔 坐标系
3
一种基于多模态与向量数据库的多目标行人重识别系统
行人重识别系统 轨迹 摄像装置 模糊阈值 图像增强
4
一种电网状态预测方法、系统及相关设备
状态预测方法 卷积神经网络模型 支路 编码 方程
5
一种分布式电源并网的优化方法及装置
分布式电源 配电网模型 粒子群算法 配网 接入节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号