摘要
本申请公开了一种基于自然语言处理的数据标注方法、装置、设备及介质,涉及数据处理技术、人工智能技术、大模型技术、大语言模型技术领域,该方法包括:获取第一数据,第一数据来自于预设信息源中的一个或多个;利用标注模型对第一数据进行打标,得到标注信息,标注模型被配置为基于预设标签分类体系对输入数据进行打标,预设标签分类体系包括分类子体系,分类子体系下具有与分类类别对应的层级描述,标注信息包括标注层级以及标注层级下的标注内容。该方法针对不同信息源的数据能够按照同一个预设标签分类体系进行打标,得到统一规则、准确且清晰的标注信息。
技术关键词
数据标注方法
层级
自然语言
标签
可读存储介质
标注装置
大语言模型
人工智能技术
数据处理技术
指令
数据获取模块
计算机程序产品
存储器
处理器
场景
样本
电子设备