众包标注数据的处理方法、处理装置、设备、介质及产品

AITNT
正文
推荐专利
众包标注数据的处理方法、处理装置、设备、介质及产品
申请号:CN202410889437
申请日期:2024-07-03
公开号:CN119226822A
公开日期:2024-12-31
类型:发明专利
摘要
本申请提供了一种众包标注数据的处理方法、处理装置、设备、介质及产品,属于数据处理技术领域。该方法包括:基于预设的标签微调模型对待处理的第一众包标注数据进行处理,得到第二众包标注数据;针对当前迭代状态,基于前一迭代状态的多个目标标注簇和第二众包标注数据确定当前迭代状态的簇数,根据当前迭代状态的簇数确定当前迭代状态的多个初始标注簇,并剔除当前迭代状态的初始标注簇中的离群的第一标签,得到当前迭代状态的多个目标标注簇;在满足预设停止条件的情况下,根据最后一个迭代状态的多个目标标注簇和第二众包标注数据进行簇聚合,得到众包处理结果。根据本申请的实施例能够提高众包标注数据的准确性。
技术关键词
众包标注数据 标签 计算机可读代码 深度优先搜索算法 电子设备 可读存储介质 数据处理技术 计算机程序产品 处理器通信 存储器 对象 模块 聚类 符号 矩形
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号