摘要
本申请实施例提供了一种文档图像的图文分离方法、装置、芯片、设备及存储介质,该方法包括:获取文档图像,将文档图像输入至训练完成的图像处理网络模型,得到输出结果,其中,输出结果包括文档图像中至少一个候选区域对应的类别标签、边界框位置和掩膜子图,候选区域为包含文本或图像的区域,根据至少一个候选区域对应的类别标签、边界框位置和掩膜子图,对文档图像中的图像和文本进行分离,得到分离后的图像内容和文本内容。本方案实现了准确提取文档图像中的图像内容和文本内容,完成高精度的图文分离,可以有效部署于复杂背景、图文交错或文本区域模糊等应用场景。
技术关键词
图像处理网络
分类网络
掩膜
图文
样本
文本
标签
区域建议网络
特征提取网络
计算机可执行指令
图像处理模块
芯片
处理器
图像增强
电子设备
参数
程序
系统为您推荐了相关专利信息
充电负荷预测方法
蒙特卡罗模拟方法
画像
高斯混合模型
负荷预测模型
XGBoost模型
计算机装置
错误率
疾病预测技术
对象