摘要
本发明公开了一种多版式合同要素提取方法、装置、设备、介质及产品,涉及信息处理技术领域。所述方法是先根据所有样本合同的多维版式特征得到多个聚类中心,然后针对各个中心,根据对应的样本要素答案、答案关键词集合和文本片段集合,对大语言模型进行模型训练,得到对应的要素答案生成模型,再然后根据多个聚类中心和待提取合同的多维版式特征,确定目标中心,并应用与目标中心对应的答案关键词集合从待提取合同中提取出文本片段新集合,最后将文本片段新集合输入与目标中心对应的要素答案生成模型中以得到待提取合同的且与目标要素问题对应的目标要素答案,如此可有效提高多版式合同要素提取结果的准确率,提升用户对待提取合同的查阅体验。
技术关键词
答案
关键词
文本
样本
初始聚类中心
大语言模型
分词
字符识别技术
信息处理技术
可读存储介质
存储计算机程序
算法
收发器
计算机程序产品
格式
指令
计算机设备
存储器
系统为您推荐了相关专利信息
机器视觉算法
图像识别算法
进化算法
元素
深度神经网络算法
数据驱动策略
应急控制方法
预测控制方法
训练深度学习模型
循环神经网络模型
语义向量
融合神经网络
时间序列建模技术
动态知识图谱
会议场景