摘要
本申请实施例提供了一种跨页单元格合并方法和装置、电子设备、存储介质,属于人工智能技术领域。该方法包括:基于表格区域检测子模型对目标文档文件的第一文件图像进行表格检测,并基于得到的第一表格区域数据和第一区域标签对第一文件图像和目标文档文件的第二文件进行图像合并,得到跨页表格合并图像;基于图像特征提取子模型对跨页表格合并图像提取得到跨页图像特征;基于文本特征提取子模型对跨页表格合并图像提取得到跨页文本特征;基于特征融合子模型对跨页图像特征和跨页文本特征融合得到跨页融合特征;基于单元格检测子模型对跨页融合特征进行单元格检测得到目标跨页单元格数据。本申请实施例能够提高对跨页表格中单元格合并的准确性。
技术关键词
表格
文本行
图像特征提取
融合特征
标签
数据
合并方法
图像拼接
特征提取模块
电子设备
字符
可读存储介质
人工智能技术
处理器
序列
存储器
计算机
系统为您推荐了相关专利信息
知识问答系统
知识问答方法
机器学习算法
文本
答案
下采样方法
无监督学习
像素
图像
深度神经网络模型
服务访问方法
分数预测模型
注意力模型
客户端
访问第三方服务