摘要
本发明公开了基于文本引导语义感知的红外与可见光图像融合方法及系统,涉及图像融合技术领域;利用语义分割的参考图像获取文本提示,利用结构相同但是参数独立的编码器分别获取源图像的特征。在编码器与解码器之间,提出语义对应对齐模块,获取与文本特征相关的丰富的特征表示,以此缩小文本与图像模态之间的差距。在解码器阶段,提出了语义调制模块,充分实现文本与图像之间的交互,并结合浅层特征,实现纹理细节与高级语义信息的有效结合,最终生成语义丰富、细节完整的融合图像,本发明在语义一致性和感知质量方面显著提升了融合图像的整体质量。
技术关键词
可见光图像
语义
融合方法
图像编码器
文本特征向量
文本编码器
红外图像特征
融合图像特征
多层感知器
跨模态
注意力机制
缩放参数
对齐模块
视觉特征
图像融合技术
深度特征提取
冗余
系统为您推荐了相关专利信息
采样器
构建训练集
上采样
通道注意力机制
语义特征
建筑构件
Kruskal算法
建模方法
Sigmoid函数
三维点云数据
计算机执行指令
文本生成方法
序列
规划
文本生成装置