一种基于众包的分词标注质量评估系统

正文

推荐专利

一种基于众包的分词标注质量评估系统

申请号：CN202411707022

申请日期：2024-11-27

公开号：CN119204007B

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了一种基于众包的分词标注质量评估系统，涉及标注质量评估领域，用于解决众包用户的主观理解能力存在差异导致提交的标注结果与对应类型存在偏差，使得质量识别不清的问题，采集文本分词置信度评分、文本对应类型与其余类型标准相似度、用户本轮标注数量差以及用户历史标注正确率差值建立数据分析模型，得到偏差评估系数并与偏差阈值比对，得到并统计比对结果，进一步确定标注结果错误提交的可能，标记为再划分标注结果，可划分类别相似度以及最相似标注结果对应的类别与最相似类别相似差异制定一组模糊规则进行模糊推理，确定再划分标注结果的划分方案，弥补了当前系统无法捕捉用户主观性差异的空白，提高标注效率。

技术关键词

偏差评估系统正确率分词文本数值数据分析模型数据处理模块模糊规则模糊集合模糊推理数据采集模块分析模块模糊逻辑标记表达式定义变量信号

一种基于众包的分词标注质量评估系统

站点导航

APP 下载