摘要
本申请公开了一种跨页表格合并方法、设备和存储介质,本申请涉及图像处理技术领域,所述跨页表格合并方法包括:解析出目标文档包含的待提取表格;根据待提取表格中表格单元的坐标信息提取待提取表格的表格结构特征,以及根据待提取表格中表格单元的文本信息提取待提取表格的表格语义特征;调用目标模型将表格结构特征以及表格语义特征拼接后的融合特征,通过应用注意力以及分类器,确定至少一组跨页表格,其中,一组跨页表格包含至少两页目标待提取表格;将目标待提取表格中每列表格单元按照上下文顺序进行拼接,得到跨页表格对应的目标表格。实现了准确合并跨页表格,进而提升表格内容提取准确性的技术效果。
技术关键词
表格合并方法
双流神经网络
语义特征
线段
文本信息提取
融合特征
坐标
端点
可读存储介质
图像处理技术
分类器
注意力
列表
处理器
存储器
基准
计算机
系统为您推荐了相关专利信息
局部二值模式
初模
训练SVM分类器
LBP特征提取
数据
员工
信息化管理方法
信息化管理系统
语义特征提取
云平台
遥感影像数据
多模态
注意力机制
作物生长监测
农业遥感技术
地震断层识别方法
注意力
多尺度
表达式
输出特征