基于混合先验的场景文本图像超分辨率方法

AITNT
正文
推荐专利
基于混合先验的场景文本图像超分辨率方法
申请号:CN202510857138
申请日期:2025-06-25
公开号:CN120953062A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供基于混合先验的场景文本图像超分辨率方法。本发明包括:混合先验提取模块(HPE),退化感知分支利用约束增强机制来捕获特定于文本图像的结构退化模式,而语义文本分支则利用跨模态融合来对齐语义和视觉特征;特征融合模块(MFM),用于融合图像特征和先验知识;知识蒸馏策略,教师网络从高分辨率图像中提取丰富的结构和语义特征,学生网络通过层次约束学习预测细粒度特征表示。本发明解决了超分辨率过程中结构和语义信息利用效率低下的问题。在TextZoom数据集、真实世界数据集和四个识别基准测试数据集上的广泛实验表明,本发明超分后的文本图像具有更清晰的纹理和结构,在客观指标上优于大多数现有方法。
技术关键词
场景文本图像 超分辨率方法 视觉特征 蒸馏 教师 多模态特征融合 网络 学生 交叉注意力机制 分支 图像超分辨率 细粒度特征 语义特征 融合特征
系统为您推荐了相关专利信息
1
多智能体驱动的多模态认知方法、装置、电子设备及介质
意图 决策 交互历史数据 视觉特征提取 指令
2
一种基于AI算力架构的教学云盘数据处理方法
云盘数据处理方法 文本 编码 教学 标记
3
塑料废弃物的检测方法、装置、设备及存储介质
图像 塑料 多角度 视觉特征 区域内物体
4
一种使用大语言模型推理的多回合对话情感四重提取方法
大语言模型 实体 编码 节点 多层次
5
木结构古建筑裂缝识别定位与修复指导系统及方法
木结构古建筑 裂缝 双流神经网络 三维点云数据 有限元分析模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号