一种基于大语言模型的数据标注方法和系统

正文

推荐专利

一种基于大语言模型的数据标注方法和系统

申请号：CN202510046402

申请日期：2025-01-13

公开号：CN119961605A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于大语言模型的数据标注方法和系统，属于深度学习自然语言处理技术领域，该方法的实现包括以下步骤：数据准备：收集原始数据并进行预处理；模型选择加载：选择并加载适合的大模型，所述大模型用于对预处理后的数据进行初步标注；自动标注：利用加载的大模型对预处理后的数据进行自动标注，并对初步标注的结果进行过滤和优化；人工校验修正：对自动标注的结果进行校验，并对错误的标注进行修正；标注结果整合输出：整合修正后的标注结果，并以适当的格式输出标注数据集；模型优化与迭代：根据标注结果对大模型进行优化和迭代。本发明能够实现数据的自动标注，从而节省时间和人力成本；同时提高了数据标注的准确性和可靠性。

技术关键词

数据标注方法大语言模型机器可读程序数据标注系统格式预训练模型标注装置计算机自然语言处理器输出模块指令存储器介质图像系列批量

系统为您推荐了相关专利信息

一种城市洪水影响程度评估方法及电子设备

程度评估方法三维模型排水系统对象大语言模型

基于边缘计算与深度学习的传感器监测数据采集传输方法

数据采集频率采集传输方法压电传感器指数机械振动监测

一种基于深度学习的髁突MRI医学图像分割方法

医学图像分割方法活动轮廓模型智能裁剪特征提取模块边缘检测

一种面向医疗数据异构性的患者相似度动态融合方法

动态融合方法字段患者异构数据

一种基于知识图谱的学习路径规划方法及应用

学习路径规划方法实体英语口语训练系统图谱英语口语学习

一种基于大语言模型的数据标注方法和系统

站点导航

APP 下载