摘要
本发明提供了基于GAN的将可见光图像高效转换成红外光图像的方法,称为IMGAN。在生成网络中提出了较ConvNeXt V2轻量化且提升性能的InceptioNeXtV2网络作为编码器,解码器引入了以Mamba为代表的选择性状态空间模型,并结合了设计的提取局部信息的LFEM模块来提高图像的保真度。设计了一种引导融合策略GFS确保生成的红外图像既保留可见光图像的结构信息,又体现红外成像的物理特性。设计了纹理损失、颜色损失作为额外的辅助函数来约束双边映射来解决纹理粗糙,颜色差异的问题。在四个不同的数据集上评估了的方法,并将结果与现有的架构(包括Pix2Pix、ThermalGAN和InfraGAN)进行了比较。与InfraGAN架构相比,的方法在VEDAI数据集上的SSIM和PSNR分别提高了2.38%和7.28%。
技术关键词
可见光图像
状态空间模型
解码器
Sigmoid函数
融合策略
编码器特征
红外光
多尺度特征
生成红外图像
融合特征
注意力
通道
校正特征
纹理
线性
颜色
扫描模块
系统为您推荐了相关专利信息
调制星座
MIMO系统
解码参数
接收端
最大化准则
农业病虫害
大数据
状态空间模型
文本
交叉注意力机制
大气湿度廓线
反演方法
反演模型
长时间尺度
湿度计
快速识别方法
标识牌
语义点云
无人机
非易失性存储介质