一种标注数据自动筛选推荐方法、系统

正文

推荐专利

一种标注数据自动筛选推荐方法、系统

申请号：CN202511112134

申请日期：2025-08-08

公开号：CN120929925A

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于数据处理技术领域，提供了一种标注数据自动筛选推荐方法、系统。所述方法包括：接收包含多个标注样本的初始数据集；基于当前筛选标记为待保留的标注样本，采用置信度正则化损失函数训练分类模型；利用训练后的分类模型计算初始数据集中的各标注样本的交叉熵损失项与对应置信度正则化项的和，作为该标注样本的正则化损失值；将每个标注样本的正则化损失值与对应的筛选阈值进行比较，若正则化损失值小于筛选阈值，则将该标注样本的筛选标记更新为待保留，否则更新为待排除。本发明能够精准剥离噪声标签，筛选出高质量样本，减少噪声干扰，提升模型训练效果与泛化能力。

技术关键词

训练分类模型样本推荐方法噪声标签加权损失函数标记计算机存储介质序列计算机程序产品推荐系统注意力处理器数据处理技术电子设备存储器强度数值模块

系统为您推荐了相关专利信息

一种电网通信检修计划智能排程管理系统及方法

检修计划故障预测模型管理系统历史运行数据构建预测模型

一种车辆油耗预测方法及装置

油耗预测方法油门踏板开度控制模块道路坡度数据传输模块

一种基于虚拟对抗训练的图像伪标签标注方法

标签标注方法置信度阈值样本预测图像数据数据分布

一种基于智能决策的大数据综合监管平台

综合监管平台语义标签矩阵异构决策

一种轴承剩余寿命预测模型的迁移学习方法及电子设备

轴承剩余寿命预测迁移学习方法分类器样本预测轴承剩余寿命

一种标注数据自动筛选推荐方法、系统

站点导航

APP 下载