摘要
本公开提供了一种标注数据处理方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取初始标注指令数据集,初始标注指令数据集包括标注回复文本数据;基于初始标注指令数据集中的标注回复文本数据,得到筛选标注指令数据集,筛选标注指令数据集中的标注回复文本数据不具有重复内容;基于筛选标注指令数据集,确定内容问题类型;基于内容问题类型以及多种不同类型的大模型,对筛选标注指令数据集进行处理,得到目标标注指令数据集。
技术关键词
标注数据处理方法
文本
格式
样本
分词
生成指令
预训练语言模型
标识符
列表
计算机存储介质
数据处理装置
处理单元
人工智能技术
模板
处理器
算法
系统为您推荐了相关专利信息
面料疵点
实时图像
神经网络模型
摄像单元
输送单元
火电设备
闭环方法
案例知识库
大语言模型
调度算法