摘要
本发明公开了一种文档布局重建方法、装置和系统及存储介质,涉及计算机视觉及自然语言处理领域,包括:输入原始文档,并将原始文档分页转为文档图像;定位所述文档图像中的各版面元素区域并进行分类,得到每个版面元素的类别及位置;判断对应分页能否直接进行代码解析且是否未包含表格;根据每个版面元素的位置,将每个版面元素的类别与文本相关信息进行匹配,对每个版面元素进行排序,再针对类别为文档标题以及层级标题的版面元素增加层级信息,由此实现具有目录结构的文档布局重建。该方法结合图像处理、机器学习和深度学习等算法,通过理解和提取文档的逻辑结构和物理布局,实现对文档结构的高效识别和重建,为自动化文档处理和信息提取提供有力支持,具有通用、高效、高精度的特点。
技术关键词
实例分割算法
布局
元素
层级
文本行
表格
深度学习网络模型
关系
分析单元
目录
重建系统
计算机视觉
节点
图表
逻辑
自然语言
处理器
图像处理
系统为您推荐了相关专利信息
PLC系统
芯片测试数据
协议转换电路
IO模块结构
组态