摘要
本发明涉及信息处理技术领域,具体公开了一种基于大模型的两阶段电子合同要素提取方法,包括S1:构建直接问答模块,将电子合同文件输入大模型,根据预设提示工程获取要素的初步提取结果及关联上下文文本;S2:构建文本切分和语义检索模块,使用文本切分模块对电子合同文本执行段落切分生成段落集合,使用语义检索模块根据关联上下文文本对段落列表执行相似度打分并排序,生成候选段落集合;S3:构建精准回答模块,基于候选段落集合和预设二次提示工程执行要素类型判断和精准提取,输出最终提取结果;通过大模型结合提示工程实现初步要素提取,再通过语义相似度计算召回原始段落进行二次验证,满足现代电子合同管理对高效、精准要素提取的需求。
技术关键词
文本
语义
预训练语言模型
模块
关键词
列表
电子合同管理
序列
阶段
格式
强化学习框架
变换器
模板
代表
信息处理技术
实体
注意力机制
索引
身份证