基于混合先验的场景文本图像超分辨率方法

正文

推荐专利

基于混合先验的场景文本图像超分辨率方法

申请号：CN202510857138

申请日期：2025-06-25

公开号：CN120953062A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供基于混合先验的场景文本图像超分辨率方法。本发明包括：混合先验提取模块(HPE)，退化感知分支利用约束增强机制来捕获特定于文本图像的结构退化模式，而语义文本分支则利用跨模态融合来对齐语义和视觉特征；特征融合模块(MFM)，用于融合图像特征和先验知识；知识蒸馏策略，教师网络从高分辨率图像中提取丰富的结构和语义特征，学生网络通过层次约束学习预测细粒度特征表示。本发明解决了超分辨率过程中结构和语义信息利用效率低下的问题。在TextZoom数据集、真实世界数据集和四个识别基准测试数据集上的广泛实验表明，本发明超分后的文本图像具有更清晰的纹理和结构，在客观指标上优于大多数现有方法。

技术关键词

场景文本图像超分辨率方法视觉特征蒸馏教师多模态特征融合网络学生交叉注意力机制分支图像超分辨率细粒度特征语义特征融合特征

系统为您推荐了相关专利信息

多智能体驱动的多模态认知方法、装置、电子设备及介质

意图决策交互历史数据视觉特征提取指令

一种基于AI算力架构的教学云盘数据处理方法

云盘数据处理方法文本编码教学标记

塑料废弃物的检测方法、装置、设备及存储介质

图像塑料多角度视觉特征区域内物体

一种使用大语言模型推理的多回合对话情感四重提取方法

大语言模型实体编码节点多层次

木结构古建筑裂缝识别定位与修复指导系统及方法

木结构古建筑裂缝双流神经网络三维点云数据有限元分析模型

基于混合先验的场景文本图像超分辨率方法

站点导航

APP 下载