一种基于大模型的数据标注方法、系统、终端及介质

AITNT
正文
推荐专利
一种基于大模型的数据标注方法、系统、终端及介质
申请号:CN202510912317
申请日期:2025-07-03
公开号:CN120408421B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及数据标注领域,具体公开一种基于大模型的数据标注方法、系统、终端及介质,包括:获取标准化数据集;加载微调后的领域模型对标准化数据集进行批量预标注,获得标准化数据集的预标注结果;计算标准化数据集中每个样本的预测不确定性,根据预测不确定性选取若干样本构成第一待审核数据集;预测标准化数据集中每个样本对领域模型改进的贡献度,根据改进贡献度选取若干样本构成第二待审核数据集;将第一待审核数据集和第二待审核数据集取并集生成待审核目标数据集,对待审核目标数据集中的各个样本的预标注结果进行人工审核;根据人工审核结果获得标准化数据集的标注结果。本发明提高数据标注效率和精度。
技术关键词
数据标注方法 样本 数据标注系统 聚类算法 可读存储介质 参数 熵值法 序列 批量 动态 密度 程序 数据格式 终端 模块 训练集 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号