摘要
本发明涉及文物图像识别领域,尤其涉及一种基于多尺度特征融合和残差注意力机制的文本图像增强方法,该方法包括:获取历史材料数据集,对其中的文本区域进行标注构建真实文本图像数据集;生成与历史材料文本区域相同格式的图像构建合成数据集;对合成数据集引入多种噪声类型以模拟实际老旧文本图像可能出现的问题;提出一种改进的U‑Net网络用于文本图像增强,以更好地学习真实图像与退化文本图像之间的映射关系;采用多尺度特征感知与提取模块提取图像中的特征信息,以提高图像对比度并解决噪声问题;通过残差注意力模块对提取到的特征进行进一步处理,有效地关注图像中的重要区域;通过特征增强模块进一步优化图像特征,增强图像细节和对比度;本发明用于历史材料的文本提取模型图像去噪效果均超过现有的模型。
技术关键词
残差注意力机制
多尺度特征融合
图像增强方法
文本
对比度
图像去噪模型
模块
通道注意力机制
深度特征提取
图像特征信息
编码器特征
图像多尺度
数据
解码器结构