文档图像的图文分离方法、装置、芯片、设备及存储介质

AITNT
正文
推荐专利
文档图像的图文分离方法、装置、芯片、设备及存储介质
申请号:CN202510218325
申请日期:2025-02-26
公开号:CN120071371A
公开日期:2025-05-30
类型:发明专利
摘要
本申请实施例提供了一种文档图像的图文分离方法、装置、芯片、设备及存储介质,该方法包括:获取文档图像,将文档图像输入至训练完成的图像处理网络模型,得到输出结果,其中,输出结果包括文档图像中至少一个候选区域对应的类别标签、边界框位置和掩膜子图,候选区域为包含文本或图像的区域,根据至少一个候选区域对应的类别标签、边界框位置和掩膜子图,对文档图像中的图像和文本进行分离,得到分离后的图像内容和文本内容。本方案实现了准确提取文档图像中的图像内容和文本内容,完成高精度的图文分离,可以有效部署于复杂背景、图文交错或文本区域模糊等应用场景。
技术关键词
图像处理网络 分类网络 掩膜 图文 样本 文本 标签 区域建议网络 特征提取网络 计算机可执行指令 图像处理模块 芯片 处理器 图像增强 电子设备 参数 程序
系统为您推荐了相关专利信息
1
一种考虑随机和认知不确定性的网络业务确信可靠度算法
网络业务 节点 网络拓扑结构 链路 样本
2
一种基于多模态大模型的轨道缺陷检测方法及装置
多模态 缺陷检测方法 视觉特征 基础 解码器
3
图表解析方法、装置、电子设备及存储介质
大语言模型 解析方法 图表 视觉特征 模块
4
基于用户画像的电动汽车充电负荷预测方法、系统及介质
充电负荷预测方法 蒙特卡罗模拟方法 画像 高斯混合模型 负荷预测模型
5
肺栓塞预测方法、装置、设备及介质
XGBoost模型 计算机装置 错误率 疾病预测技术 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号