摘要
本申请提供了一种众包标注数据的处理方法、处理装置、设备、介质及产品,属于数据处理技术领域。该方法包括:基于预设的标签微调模型对待处理的第一众包标注数据进行处理,得到第二众包标注数据;针对当前迭代状态,基于前一迭代状态的多个目标标注簇和第二众包标注数据确定当前迭代状态的簇数,根据当前迭代状态的簇数确定当前迭代状态的多个初始标注簇,并剔除当前迭代状态的初始标注簇中的离群的第一标签,得到当前迭代状态的多个目标标注簇;在满足预设停止条件的情况下,根据最后一个迭代状态的多个目标标注簇和第二众包标注数据进行簇聚合,得到众包处理结果。根据本申请的实施例能够提高众包标注数据的准确性。
技术关键词
众包标注数据
标签
计算机可读代码
深度优先搜索算法
电子设备
可读存储介质
数据处理技术
计算机程序产品
处理器通信
存储器
对象
模块
聚类
符号
矩形