摘要
本申请实施例提供一种处理文档图像的方法、装置及电子设备,所述方法包括:获取文档图像;将所述文档图像作为目标图像文件处理模型的输入,并通过所述目标图像文件处理模型得到结构化信息,其中,所述目标图像文件处理模型包括:目标文本嵌入模块、目标空间信息嵌入模块、目标图像特征嵌入模块以及目标BERT模块,所述目标空间信息嵌入模块用于挖掘所述文档图像中元素的位置信息,所述目标图像特征嵌入模块用于挖掘所述文档图像中元素的图像特征。与本领域其他文档图像处理模型对比,本申请实施例记载的目标图像文件处理模型在性能和有效性方面具有更好的效果。
技术关键词
文本
元素
文档图像识别
图像嵌入
文档图像处理
BERT模型
光学字符识别
电子设备
文档分类
图像获取模块
视觉
感兴趣
排版
多标签
图像分割
网络
图标
处理器
系统为您推荐了相关专利信息
识别方法
特征提取模型
关键词
非暂态计算机可读存储介质
样本
网页数据解析方法
大语言模型
页面
多源融合
标签