文档图像的图文分离方法、装置、芯片、设备及存储介质

正文

推荐专利

申请号：CN202510218325

申请日期：2025-02-26

公开号：CN120071371A

公开日期：2025-05-30

类型：发明专利

摘要

本申请实施例提供了一种文档图像的图文分离方法、装置、芯片、设备及存储介质，该方法包括：获取文档图像，将文档图像输入至训练完成的图像处理网络模型，得到输出结果，其中，输出结果包括文档图像中至少一个候选区域对应的类别标签、边界框位置和掩膜子图，候选区域为包含文本或图像的区域，根据至少一个候选区域对应的类别标签、边界框位置和掩膜子图，对文档图像中的图像和文本进行分离，得到分离后的图像内容和文本内容。本方案实现了准确提取文档图像中的图像内容和文本内容，完成高精度的图文分离，可以有效部署于复杂背景、图文交错或文本区域模糊等应用场景。

技术关键词

图像处理网络分类网络掩膜图文样本文本标签区域建议网络特征提取网络计算机可执行指令图像处理模块芯片处理器图像增强电子设备参数程序

系统为您推荐了相关专利信息

一种考虑随机和认知不确定性的网络业务确信可靠度算法

网络业务节点网络拓扑结构链路样本

一种基于多模态大模型的轨道缺陷检测方法及装置

多模态缺陷检测方法视觉特征基础解码器

图表解析方法、装置、电子设备及存储介质

大语言模型解析方法图表视觉特征模块

基于用户画像的电动汽车充电负荷预测方法、系统及介质

充电负荷预测方法蒙特卡罗模拟方法画像高斯混合模型负荷预测模型

肺栓塞预测方法、装置、设备及介质

XGBoost模型计算机装置错误率疾病预测技术对象

文档图像的图文分离方法、装置、芯片、设备及存储介质

站点导航

APP 下载