场景引导提示表征增强的红外和可见光图像融合方法

AITNT
正文
推荐专利
场景引导提示表征增强的红外和可见光图像融合方法
申请号:CN202511467613
申请日期:2025-10-15
公开号:CN120953998A
公开日期:2025-11-14
类型:发明专利
摘要
本发明属于图像信息处理技术领域,公开一种场景引导提示表征增强的红外和可见光图像融合方法,分为两个阶段:第一阶段,构建场景提示生成网络,通过语义分割任务学习覆盖源图像的全局视觉语义信息。为进一步增强提示表征能力,设计了一个视觉感知的上下文提示模块,利用模态特定特征与文本特征之间的相关性矩阵进行交互,并通过动态加权方式细化文本特征,从而获得语义更加丰富的场景提示表示。第二阶段,提出提示引导的跨模态对齐融合网络,利用所学场景提示将红外与可见光特征映射到统一的共享嵌入空间。在此过程中,通过提示驱动特征对齐模块建立像素‑文本相似性矩阵,实现跨模态特征的精确对齐,从而获得语义一致性与细节保真的融合结果。
技术关键词
模态特征 驱动特征 可见光图像 对齐模块 红外编码器 跨模态 融合方法 场景 图像解码器 图像信息处理技术 文本编码器 生成融合图像 交叉注意力机制 语义 融合特征 网络 图像编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号