用于为大型语言模型生成领域特定训练数据的计算机实施的方法

AITNT

正文

推荐专利

用于为大型语言模型生成领域特定训练数据的计算机实施的方法

申请号：CN202411581862

申请日期：2024-11-07

公开号：CN119962482A

公开日期：2025-05-09

类型：发明专利

摘要

本发明涉及一种用于为大型语言模型(LLM)生成领域(DMN)特定训练数据(TRD)的计算机实施的方法。所提出的，该方法包括以下步骤：提供与所述领域(DMN)相关的领域(DMN)特定本体(OTG)；提供与所述领域(DMN)相关的领域(DMN)特定信息(SCI)；在用于对用于训练所述大型语言模型(LLM)的数据进行结构化的数据处理流水线(DPL)中处理所述领域(DMN)特定信息(SCI)，其中，所述领域(DMN)特定本体(OTG)在所述数据处理流水线(DPL)的步骤中被提供作为识别模式(RCP)，使得所述结构化的训练数据(STD)包括领域(DMN)特定本体(OTG)注释(ANT)。

技术关键词

数据处理流水线可编程逻辑控制器生成软件应用程序命名实体识别数据存储装置自然语言报告输入接口文本语义人机接口计算机系统生成用户分词处理器人类

添加客服微信openai178，进AITNT官方交流群

驱动智慧未来：提供一站式AI转型解决方案

沪ICP备2023015588号