摘要
本发明公开了一种基于多模态自注意力机制生成对抗网络的红外图像生成方法及装置,属于红外图像生成领域。该方法包括:对输入可见光图像进行分割,并进行线性压缩;在压缩后的图像块内部进行多层基于窗口的局部自注意力计算并引入自适应相关性掩码,得到图像的局部关联性表达;在压缩后的图像块之间进行多层基于快速全局自注意力计算,得到图像的全局关联性表达;将图像的局部关联性表达和全局关联性表达进行融合,获得包含解耦后的背景特征和目标特征的特征图;对特征图进行解码和上采样,输出与输入图像大小一致的红外图像。生成的红外图像具有正确的红外特征和更好的视觉效果。
技术关键词
注意力机制
生成对抗网络
图像块
图像生成方法
可见光图像
红外图像生成装置
多模态
多层感知机
解码
线性
图像分割
处理器
模块
可读存储介质
存储器
电子设备
计算机
系统为您推荐了相关专利信息
融合检测方法
可见光图像
空间变换模型
两阶段
特征点
网络节点
通信网络
神经网络模型
节点特征
卷积算法
救援机器人
识别定位系统
工业视觉设备
多模态图像数据
可见光图像
长短期记忆网络
生成全局热力图
时间序列图像
解释技术
注意力机制
空谱联合特征
高光谱图像解混
像素
空间光谱特征
前馈神经网络