摘要
本发明公开了一种基于分层上下文感知交互重构的场景文本消隐方法和系统,方法包括:通过轻量级的共享编码‑分离解码网络进行初步文本定位和文本区域背景重建,预测得到粗略文本掩码和粗略文本擦除图像;使用深度可分离卷积网络对粗略文本掩码进行精细化处理,通过层级掩码解码器对粗略文本掩码进行层级精细化处理;通过U‑Net特征提取器对粗略文本擦除图像进行下采样处理,并根据层级精细掩码逐层学习复杂背景与文本区域的上下文关系,解码出场景文本擦除图像;将原图像与场景文本擦除图像相加,得到最终预测图像。本发明实施例能够提供更准确的文本位置视觉信息来指导文本区域的重建,实现更好的重建效果,可广泛应用于计算机技术领域。
技术关键词
消隐方法
粗略
场景文本图像
层级
解码网络
重构
表达式
图像编码器
解码器
分层
代表
参数
语义特征
通道
特征提取网络
系统为您推荐了相关专利信息
数据生成方法
去噪模型
建筑三维模型
顶点
三维网格划分
动画生成方法
三维模型
生成设备
展示电网
加载设备
电力设备
实例分割方法
实例分割模型
语义特征
融合特征