摘要
本发明公开了一种基于语义引导的多退化图像恢复方法。该方法针对车载摄像头在恶劣天气条件下捕获的退化图像,采用基于Transformer的主干网络提取图像潜在特征,结合CLIP视觉语言模型提取多模态语义信息,通过动态文本提示生成机制为不同退化类型提供语义引导。设计了自适应特征融合模块,结合通道注意力和空间注意力机制实现多模态特征的有效整合,并引入退化特征提取与融合模块增强模型泛化能力。本发明提出的语义引导多类型图像恢复网络SGIRN,通过结合Transformer的全局建模能力与CLIP视觉语言模型的跨模态表示能力,实现对多种天气退化类型的高质量恢复。
技术关键词
图像恢复方法
特征金字塔
退化特征
语义特征
文本
多模态
特征提取模块
子模块
注意力机制
网络
多尺度特征提取
动态
视觉特征提取
恶劣天气条件
融合特征
解码器结构
系统为您推荐了相关专利信息
智能合同管理方法
文本特征向量
风险评估报告
图表
数据
意图识别模型
文本特征向量
生成方法
关键词
云端
负载均衡方法
服务器
负载均衡系统
负载均衡节点
周期