摘要
本发明涉及面向类不平衡与重叠数据分类的半监督学习欠采样方法,通过样本伪标签生成;根据生成的样本伪标签,进行样本重叠区域检测;根据检测到的样本重叠区域,进行最近邻的欠采样。本发明根据数据类别不同和属性差异引入了多元分层打伪标签策略并结合单类支持向量机算法和标签传播算法形成双重验证机制,提高伪标签的准确性;同时本发明的多元分层框架通过充分利用数据分布规律,提供了更稳定和精确的伪标签标注,该框架不仅适用于复杂领域的半监督学习,还拓展了半监督学习在不平衡和重叠耦合情况下数据处理的新应用方向。
技术关键词
欠采样方法
数据分类
双重验证机制
标签传播算法
单类支持向量机
拉格朗日
生成树
无标签样本
验证方法
数据分布
分层
决策
策略
框架
数学
系统为您推荐了相关专利信息
样本
随机森林模型
数据
土壤有机碳含量
欠采样方法
液体火箭发动机
数据近似方法
分类预测模型
诊断方法
无噪声