摘要
本发明提供了一种基于大语言模型的标注数据生成方法及系统,包括:步骤S1:获取相同类别代表性合同的结构化文本,并基于获取的代表性合同的结构化文本生成对应的信息抽取模板;步骤S2:基于信息抽取模板和相同类别内所有的合同文本,批量生成标注数据;步骤S3:汇总不同类别的标注数据及相应的合同文本,并生成标注数据集,利用标注数据集对大语言模型进行微调,得到微调后的大语言模型;步骤S4:基于微调后的大语言模型对合同文本进行标注。
技术关键词
标注数据生成方法
大语言模型
数据生成系统
合同文本数据
模板
表达式
批量
模块
参数