摘要
本发明涉及一种基于扩散模型的可见与红外光图像转换系统及方法,通过视觉语言理解模块融合文本描述生成图像文本描述,以图像文本描述作为扩散模型算法的控制标志位,使扩散模型框架执行的扩散模型算法能够根据语义指令精确调控红外图像的风格特征,最终克服了传统单风格图像转换存在风格控制方面不足的技术缺陷,且充分利用语义信息和可控制标志位,使整个系统生成的红外图像关键区域的语义一致性大幅提升。
技术关键词
图像转换系统
可见光
注意力
解码控制器
红外光
文本
编码模块
编码控制器
融合特征
编码算法
标志位
图像编码器
解码器
模型算法
模块通信
解码模块