基于文本引导语义感知的红外与可见光图像融合方法及系统

AITNT
正文
推荐专利
基于文本引导语义感知的红外与可见光图像融合方法及系统
申请号:CN202510890116
申请日期:2025-06-30
公开号:CN120765479A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于文本引导语义感知的红外与可见光图像融合方法及系统,涉及图像融合技术领域;利用语义分割的参考图像获取文本提示,利用结构相同但是参数独立的编码器分别获取源图像的特征。在编码器与解码器之间,提出语义对应对齐模块,获取与文本特征相关的丰富的特征表示,以此缩小文本与图像模态之间的差距。在解码器阶段,提出了语义调制模块,充分实现文本与图像之间的交互,并结合浅层特征,实现纹理细节与高级语义信息的有效结合,最终生成语义丰富、细节完整的融合图像,本发明在语义一致性和感知质量方面显著提升了融合图像的整体质量。
技术关键词
可见光图像 语义 融合方法 图像编码器 文本特征向量 文本编码器 红外图像特征 融合图像特征 多层感知器 跨模态 注意力机制 缩放参数 对齐模块 视觉特征 图像融合技术 深度特征提取 冗余
系统为您推荐了相关专利信息
1
一种基于YOLOv9改进的高精度红外目标检测方法
采样器 构建训练集 上采样 通道注意力机制 语义特征
2
基于扩散模型的多任务视觉基础模型图像生成方法
多任务 图像生成方法 卷积模块 视觉 适配器
3
自动解析求职者或招聘方提交的查询请求的系统及方法
画像 语义 意图类别 深度学习模型 查询意图
4
一种基于特征提取的点云建筑构件建模方法与系统
建筑构件 Kruskal算法 建模方法 Sigmoid函数 三维点云数据
5
文本生成方法、装置、电子设备及存储介质
计算机执行指令 文本生成方法 序列 规划 文本生成装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号