面向类不平衡与重叠数据分类的半监督学习欠采样方法

正文

推荐专利

申请号：CN202411047422

申请日期：2024-08-01

公开号：CN118568581A

公开日期：2024-08-30

类型：发明专利

摘要

本发明涉及面向类不平衡与重叠数据分类的半监督学习欠采样方法，通过样本伪标签生成；根据生成的样本伪标签，进行样本重叠区域检测；根据检测到的样本重叠区域，进行最近邻的欠采样。本发明根据数据类别不同和属性差异引入了多元分层打伪标签策略并结合单类支持向量机算法和标签传播算法形成双重验证机制，提高伪标签的准确性；同时本发明的多元分层框架通过充分利用数据分布规律，提供了更稳定和精确的伪标签标注，该框架不仅适用于复杂领域的半监督学习，还拓展了半监督学习在不平衡和重叠耦合情况下数据处理的新应用方向。

技术关键词

欠采样方法数据分类双重验证机制标签传播算法单类支持向量机拉格朗日生成树无标签样本验证方法数据分布分层决策策略框架数学

系统为您推荐了相关专利信息

一种基于数据增强技术的土壤有机碳预测方法和装置

样本随机森林模型数据土壤有机碳含量欠采样方法

含输入噪声多类别高斯过程的液体火箭发动机变分推断学习与诊断方法

液体火箭发动机数据近似方法分类预测模型诊断方法无噪声

业务载体自动化注册登录及资金账户获取方法及系统

虚拟身份信息元素坐标队列账户

基于VOCs远程运维的监测方法及系统

有机挥发物管理系统监测站监测方法曲线

一种投资项目一体化数据管理与智能审查方法及系统

项目数据分类合规性大语言模型文本区域检测

面向类不平衡与重叠数据分类的半监督学习欠采样方法

站点导航

APP 下载