摘要
本发明涉及计算机视觉和图像处理技术领域,公开了基于两阶段参考图像引导的场景文本图像超分辨率方法,包括通过两阶段参考图像引导机制,解决文本保真度与纹理细节不足问题:第一阶段利用印刷体参考图像结构先验,结合风格迁移和块匹配对齐;第二阶段通过可变形卷积和交叉注意力融合优化纹理,显著改善超分辨率图像的清晰度、保真度;针对评价指标侧重图像质量的问题,借助精准特征对齐和多层次融合保留文本信息,注意力增强对齐避免噪声,交叉注意力利用参考图像细节,大幅提升场景文本识别准确率,在数据集竞争力强;引入多种视觉先验,挖掘特征对应关系,解决泛化能力不足;两阶段架构适应不同输入质量,提升复杂场景处理能力。
技术关键词
场景文本图像
超分辨率方法
两阶段
场景文本识别
交叉注意力机制
印刷体
梯度轮廓
对齐模块
深度卷积神经网络结构
三元组
图像特征提取
样本
风格迁移方法
融合策略
系统为您推荐了相关专利信息
交叉注意力机制
文本识别方法
融合特征
感知特征
字符
柔性车间调度
融合算法
深度强化学习模型
异构
节点特征
银行卡
二维离散小波变换
图像超分辨率
场景文本识别
卷积模块
点云语义地图
数据
视觉
剔除噪声
三维点云地图构建