摘要
本申请提出一种数据清洗标注方法、装置、电子设备及存储介质,属于数据处理领域。方法包括:利用第一数据集,对基础模型进行训练,得到识别模型;基于识别模型,得到第一数据集和第二数据集的推理结果,第二数据集包括未标注的复杂样本;根据推理结果,对第一数据集进行标签修改,对第二数据集进行标注;在推理结果不满足结束条件的情况下,从第一数据集和第二数据集中,得到新的第一数据集和第二数据集。如此,通过循环的方式,基于少数已标注的简单样本,自动化实现对待标注的复杂样本的标注,以及对已标注的简单样本的标签修正,大大提升了标注效率,减少了人力成本,且在一定程度上避免引入人工误差,以此确保了样本标签的准确性。
技术关键词
标注方法
数据
样本
标签
模型训练模块
电子设备
标注装置
处理器
基础
存储器
指令
人力
误差
系统为您推荐了相关专利信息
智能监控系统
平台模块
蒸汽调节阀
数据采集模块
控制模块
嵌入特征
标签嵌入方法
关键词
BP神经网络
文本
定位方法
深度学习框架
索引
位置提取
生成深度学习