摘要
本公开提供了一种表格数据抽取方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及表格数据处理技术领域。实现方案为:基于表格中每个单元格的内容,从表格中确定至少一个表头单元格和至少一个数据单元格;基于至少一个表头单元格的内容以及多个候选表格模板中每个候选表格模板包括的至少一个表头,确定每个候选表格模板与表格的表头相似度;基于每个候选表格模板与表格的表头相似度,从多个候选表格模板中确定对应于表格的目标表格模板;从至少一个表头单元格中抽取与目标表格模板包括的至少一个表头分别对应的至少一个目标表头内容;以及基于至少一个目标表头内容,从至少一个数据单元格中抽取目标数据内容。
技术关键词
表格模板
表头
数据抽取方法
表格数据处理技术
数据抽取装置
编码
合并单元格
布局特征
人工智能技术
计算机程序产品
处理器通信
指令
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
寿命预测方法
Copula函数
变量
AIC准则
参数更新模块