摘要
本申请公开了一种样本标注方法、装置、设备及存储介质,涉及数据标注技术领域,包括:基于标签数据集训练目标模型,得到各待标注数据的伪标签以及伪标签的置信度;基于待标注数据集以及对应的伪标签和置信度构建原始伪标签数据集,并根据置信度划分原始伪标签数据集,得到多个原始伪标签子数据集;根据各原始伪标签子数据集的伪标签准确性评估结果和置信度对各伪标签进行加权,得到加权伪标签数据集;合并加权伪标签数据集和标签数据集,以根据新的标签数据集对目标模型进行训练。本申请通过将人工抽样确认的数据融入半监督学习流程,并在标注过程中引入对伪标签权重的适应性调整,实现了在减少人工标注成本的同时提高了样本标注的准确性。
技术关键词
样本标注方法
标签
标注装置
数据标注技术
半监督学习
处理器
可读存储介质
模块
存储器
指标
电子设备
计算机
策略
系统为您推荐了相关专利信息
智能问答方法
大语言模型
训练智能
问答模型
金融
残差神经网络
影像分类方法
高分辨率卫星遥感影像
变换器模块
像素
医学知识库
检索装置
权限管理模块
高频RFID标签
资料