基于大语言模型的标注数据生成方法及系统

AITNT
正文
推荐专利
基于大语言模型的标注数据生成方法及系统
申请号:CN202411704053
申请日期:2024-11-26
公开号:CN119557646A
公开日期:2025-03-04
类型:发明专利
摘要
本发明提供了一种基于大语言模型的标注数据生成方法及系统,包括:步骤S1:获取相同类别代表性合同的结构化文本,并基于获取的代表性合同的结构化文本生成对应的信息抽取模板;步骤S2:基于信息抽取模板和相同类别内所有的合同文本,批量生成标注数据;步骤S3:汇总不同类别的标注数据及相应的合同文本,并生成标注数据集,利用标注数据集对大语言模型进行微调,得到微调后的大语言模型;步骤S4:基于微调后的大语言模型对合同文本进行标注。
技术关键词
标注数据生成方法 大语言模型 数据生成系统 合同文本数据 模板 表达式 批量 模块 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号