摘要
本发明涉及一种用于为大型语言模型(LLM)生成领域(DMN)特定训练数据(TRD)的计算机实施的方法。所提出的,该方法包括以下步骤:提供与所述领域(DMN)相关的领域(DMN)特定本体(OTG);提供与所述领域(DMN)相关的领域(DMN)特定信息(SCI);在用于对用于训练所述大型语言模型(LLM)的数据进行结构化的数据处理流水线(DPL)中处理所述领域(DMN)特定信息(SCI),其中,所述领域(DMN)特定本体(OTG)在所述数据处理流水线(DPL)的步骤中被提供作为识别模式(RCP),使得所述结构化的训练数据(STD)包括领域(DMN)特定本体(OTG)注释(ANT)。
技术关键词
数据处理流水线
可编程逻辑控制器
生成软件应用程序
命名实体识别
数据存储装置
自然语言
报告
输入接口
文本
语义
人机接口
计算机系统
生成用户
分词
处理器
人类