摘要
本申请公开了基于置信度的编程弱监督标注方法、装置、设备及介质,涉及数据标注技术领域,利用标注函数为未标注数据提供弱标签,得到弱数据集;基于标注数据集和弱数据集对模型进行训练,得到可靠模型和非可靠模型;利用标注数据集对非可靠模型评估,得到模型评估准确率,基于双重评估机制并利用可靠模型对弱数据集评估,得到数据集评估准确率及置信度分数;对标注数据集和弱数据集进行标签类别分布统计,得到标签类型分布向量,计算在剪枝策略中标注数据集的第一保留比例及弱数据集的第二保留比例;根据第二保留比例及置信度分数对弱数据集剪枝融合,得到目标数据集,提高编程弱监督数据标注准确性和效率,提升数据点质量。
技术关键词
剪枝策略
标签类别
数据标注方法
编程
数据标注技术
模型训练模块
标注装置
机制
可读存储介质
文本
处理器
电子设备
图像
存储器
计算机
系统为您推荐了相关专利信息
坐标
现场可编程逻辑门阵列
点云数据处理方法
参数
电子设备
注意力神经网络
生成方法
图像块
注意力机制
视觉
轴承故障诊断方法
故障诊断模型
特征提取器
滚动轴承
代表
数据传输保障机制
保障方法
环境监测数据
报文
定义
孔隙网络模型
岩土介质
多尺度
Delaunay三角剖分
空隙