摘要
本申请公开了一种数据自动标注的方法、装置及存储介质,涉及数据处理技术领域,用于对数据进行自动标注,同时提高标注效率和标注质量。本申请方法:将每个任务的数据进行人工预标注,得到预标注数据;针对每个任务自动派生出多个不同的提示词方案;根据提示词方案,将所有的任务导入至多模态大模型中分别进行独立提问,并获取各提示词方案相对应的第一输出结果;采用无监督的投票算法进行结果提取,生成每个任务的投票统计结果;若正相关标记数量达到或超过选举阈值,即判定该任务为正相关样本;将预标注数据和正相关样本输入单模态小模型进行训练迭代;使用单模态小模型对待标注的目标数据批量进行自动标注,输出标注结果。
技术关键词
投票算法
标记
输入输出单元
无监督
样本
批量
机制
多任务
可读存储介质
多模态
数据处理技术
申请方法
提示方法
传播算法
存储器
程序
计算机
处理器
处理单元
系统为您推荐了相关专利信息
控制爆破方法
隧道模型
爆破药卷
隧道地质
监测点