一种基于多尺度特征融合和残差注意力机制的文本图像增强方法

正文

推荐专利

申请号：CN202510394904

申请日期：2025-03-31

公开号：CN120450978A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及文物图像识别领域，尤其涉及一种基于多尺度特征融合和残差注意力机制的文本图像增强方法，该方法包括：获取历史材料数据集，对其中的文本区域进行标注构建真实文本图像数据集；生成与历史材料文本区域相同格式的图像构建合成数据集；对合成数据集引入多种噪声类型以模拟实际老旧文本图像可能出现的问题；提出一种改进的U‑Net网络用于文本图像增强，以更好地学习真实图像与退化文本图像之间的映射关系；采用多尺度特征感知与提取模块提取图像中的特征信息，以提高图像对比度并解决噪声问题；通过残差注意力模块对提取到的特征进行进一步处理，有效地关注图像中的重要区域；通过特征增强模块进一步优化图像特征，增强图像细节和对比度；本发明用于历史材料的文本提取模型图像去噪效果均超过现有的模型。

技术关键词

残差注意力机制多尺度特征融合图像增强方法文本对比度图像去噪模型模块通道注意力机制深度特征提取图像特征信息编码器特征图像多尺度数据解码器结构

一种基于多尺度特征融合和残差注意力机制的文本图像增强方法

站点导航

APP 下载