摘要
本发明提供基于混合先验的场景文本图像超分辨率方法。本发明包括:混合先验提取模块(HPE),退化感知分支利用约束增强机制来捕获特定于文本图像的结构退化模式,而语义文本分支则利用跨模态融合来对齐语义和视觉特征;特征融合模块(MFM),用于融合图像特征和先验知识;知识蒸馏策略,教师网络从高分辨率图像中提取丰富的结构和语义特征,学生网络通过层次约束学习预测细粒度特征表示。本发明解决了超分辨率过程中结构和语义信息利用效率低下的问题。在TextZoom数据集、真实世界数据集和四个识别基准测试数据集上的广泛实验表明,本发明超分后的文本图像具有更清晰的纹理和结构,在客观指标上优于大多数现有方法。
技术关键词
场景文本图像
超分辨率方法
视觉特征
蒸馏
教师
多模态特征融合
网络
学生
交叉注意力机制
分支
图像超分辨率
细粒度特征
语义特征
融合特征
系统为您推荐了相关专利信息
木结构古建筑
裂缝
双流神经网络
三维点云数据
有限元分析模型