摘要
本申请公开了一种文档解析方法、装置、电子设备及存储介质,属于文档处理技术领域,用以解决相关的文档解析技术,成本高、效率低和解析精度差的问题。该方法,包括:获取待解析文档,并将所述待解析文档转化成页面图像;对所述页面图像进行版式分析,确定所述页面图像中的至少一个区域,并对每个所述区域进行复杂度评估,得到每个所述区域对应的评估结果;根据所述区域对应的所述评估结果,确定对应的目标解析引擎,并通过所述目标解析引擎,对所述区域进行解析,得到每个所述区域的解析结果;基于每个所述区域的所述解析结果,生成结构化文档。
技术关键词
文档解析方法
页面
图像
文档解析技术
元素
复杂度
光学字符识别
文本
计算机可执行指令
电子设备
解析装置
语义
表格
分析模块
处理器
印章
图片
系统为您推荐了相关专利信息
加密数据
标识
账户
身份认证安全性
对称加密算法
SVM分类器
感兴趣区域图像
卷积神经网络模型
实时图像
计算机可读指令
预警系统
故障检测模块
无线传输模块
单片机
多尺度特征提取