摘要
本申请公开了一种文档解析方法、装置、电子设备及存储介质,属于文档处理技术领域,用以解决相关的文档解析技术,成本高、效率低和解析精度差的问题。该方法,包括:获取待解析文档,并将所述待解析文档转化成页面图像;对所述页面图像进行版式分析,确定所述页面图像中的至少一个区域,并对每个所述区域进行复杂度评估,得到每个所述区域对应的评估结果;根据所述区域对应的所述评估结果,确定对应的目标解析引擎,并通过所述目标解析引擎,对所述区域进行解析,得到每个所述区域的解析结果;基于每个所述区域的所述解析结果,生成结构化文档。
技术关键词
文档解析方法
页面
图像
文档解析技术
元素
复杂度
光学字符识别
文本
计算机可执行指令
电子设备
解析装置
语义
表格
分析模块
处理器
印章
图片
系统为您推荐了相关专利信息
实体
模型训练方法
知识图谱构建
数据处理方法
矩阵
台秤
数据分析方法
物联网技术
LSTM模型
可视化界面