摘要
本申请涉及一种表格数据抽取方法、装置、计算机设备和存储介质,其中,该表格数据抽取方法包括:根据预设的第一大语言模型和第二大语言模型,确定各样本文档中的多个典型表格;其中,第一大语言模型用于对每个样本文档中的样本表格进行表格抽取,第二大语言模型用于基于表格抽取结果确定各样本文档中的多个典型表格;确定各典型表格中与目标文档中待抽取表格相匹配的目标典型表格;在目标典型表格关联有格式修正信息时,基于格式修正信息对待抽取表格进行修正;基于修正后待抽取表格的格式,对待抽取表格进行表格抽取,得到待抽取表格中的表格数据。通过本申请,解决了针对复杂表格数据的精细抽取效果不佳的问题,实现了复杂表格数据的精细抽取。
技术关键词
表格
大语言模型
数据抽取方法
样本
典型
格式
数据抽取装置
计算机设备
逻辑
分析模块
图像
匹配模块
处理器
可读存储介质
文本
存储器
标记
系统为您推荐了相关专利信息
噪声生成装置
图像预处理装置
酒瓶
图像收集装置
图像识别装置
剩余使用寿命
寿命预测方法
谐波减速器
输出特征
物理
无人机遥感数据
激光雷达点云数据
多光谱
热成像
机器学习模型训练
深度学习语义分割
岩溶地貌
卫星遥感影像数据
高原
迁移学习算法