摘要
本申请公开了一种文档处理方法、装置、设备及存储介质,涉及数据处理技术领域,公开的文档处理方法包括:获取待处理文档,并识别待处理文档中的文本区域以及图像区域;对文本区域进行文本提取,得到矢量文本内容;通过多个光学字符识别模型对图像区域进行字符识别并获取识别结果;在识别结果中根据各光学字符识别模型对应的字符识别结果确定置信度权重;根据各置信度权重将各字符识别结果与矢量文本内容进行融合,得到融合后文本内容;根据融合后文本内容输出结构化数据或半结构化数据,从而能够兼容混合类型的文档输入,实现对包含文本区域和图像区域的混合类型文档的处理,有效满足了用户需求。
技术关键词
树状结构模型
文本
光学字符识别
层次结构信息
排版信息
图像
数据输出模块
数据处理技术
表达式
字体
处理器
表格
输入模块
层级
可读存储介质
嵌套
系统为您推荐了相关专利信息
施工管理方法
施工平台
施工现场数据
资料
生成会议记录
文本预测方法
大语言模型
非临时性计算机可读存储介质
电子设备
存储计算机程序