摘要
本申请涉及数据标注方法、装置、设备及可读存储介质。前述数据标注方法包括:首先,将待标注数据和提示词输入至第一预训练大语言模型中,生成第一预测数据标注结果,并分析其置信度,基于符合第一置信度阈值的结果生成第一数据标注结果。对于不符合第一置信度阈值的结果,输入至第二预训练大语言模型进行再标注,分析其置信度并生成第二数据标注结果。对于不符合第二置信度阈值的结果,进行人工标注,最终合并第一、第二和人工标注结果,确定最终的标注结果。本方法通过多轮预训练大语言模型的自动标注和置信度分析,结合人工标注处理低置信度的任务,显著提高了标注准确性和效率,减少了对人工干预的依赖。
技术关键词
大语言模型
置信度阈值
数据标注方法
可读存储介质
存储计算机程序
标注装置
输出模块
存储器
处理器
答案
指令