用于为大型语言模型生成领域特定训练数据的计算机实施的方法

AITNT
正文
推荐专利
用于为大型语言模型生成领域特定训练数据的计算机实施的方法
申请号:CN202411581862
申请日期:2024-11-07
公开号:CN119962482A
公开日期:2025-05-09
类型:发明专利
摘要
本发明涉及一种用于为大型语言模型(LLM)生成领域(DMN)特定训练数据(TRD)的计算机实施的方法。所提出的,该方法包括以下步骤:提供与所述领域(DMN)相关的领域(DMN)特定本体(OTG);提供与所述领域(DMN)相关的领域(DMN)特定信息(SCI);在用于对用于训练所述大型语言模型(LLM)的数据进行结构化的数据处理流水线(DPL)中处理所述领域(DMN)特定信息(SCI),其中,所述领域(DMN)特定本体(OTG)在所述数据处理流水线(DPL)的步骤中被提供作为识别模式(RCP),使得所述结构化的训练数据(STD)包括领域(DMN)特定本体(OTG)注释(ANT)。
技术关键词
数据处理流水线 可编程逻辑控制器 生成软件应用程序 命名实体识别 数据存储装置 自然语言 报告 输入接口 文本 语义 人机接口 计算机系统 生成用户 分词 处理器 人类
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号