基于文本引导语义感知的红外与可见光图像融合方法及系统

正文

推荐专利

申请号：CN202510890116

申请日期：2025-06-30

公开号：CN120765479A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于文本引导语义感知的红外与可见光图像融合方法及系统，涉及图像融合技术领域；利用语义分割的参考图像获取文本提示,利用结构相同但是参数独立的编码器分别获取源图像的特征。在编码器与解码器之间,提出语义对应对齐模块,获取与文本特征相关的丰富的特征表示,以此缩小文本与图像模态之间的差距。在解码器阶段,提出了语义调制模块,充分实现文本与图像之间的交互,并结合浅层特征,实现纹理细节与高级语义信息的有效结合,最终生成语义丰富、细节完整的融合图像，本发明在语义一致性和感知质量方面显著提升了融合图像的整体质量。

技术关键词

可见光图像语义融合方法图像编码器文本特征向量文本编码器红外图像特征融合图像特征多层感知器跨模态注意力机制缩放参数对齐模块视觉特征图像融合技术深度特征提取冗余

系统为您推荐了相关专利信息

一种基于YOLOv9改进的高精度红外目标检测方法

采样器构建训练集上采样通道注意力机制语义特征

基于扩散模型的多任务视觉基础模型图像生成方法

多任务图像生成方法卷积模块视觉适配器

自动解析求职者或招聘方提交的查询请求的系统及方法

画像语义意图类别深度学习模型查询意图

一种基于特征提取的点云建筑构件建模方法与系统

建筑构件 Kruskal算法建模方法 Sigmoid函数三维点云数据

文本生成方法、装置、电子设备及存储介质

计算机执行指令文本生成方法序列规划文本生成装置

基于文本引导语义感知的红外与可见光图像融合方法及系统

站点导航

APP 下载