摘要
本发明具体涉及一种多源提示的红外目标图像定制化生成方法,该方法采用多要素文本编码模块对多要素文本进行编码,并输入到基于Transformer的红外图像生成主干网络进行感知关联映射,提升了生成图像与给定多要素文本的一致性。在红外图像生成时,通过分层重绘方法对输入的特定目标图像进行定制化生成。能够从目标红外图像和多要素文本,生成对应目标在多要素文本对应的背景中的红外图像,实现红外图像的定制化生成。使用分层重绘方法,在图像生成的过程中输入进不同的去噪步中,提高了红外图像的生成效果。
技术关键词
独立特征
分层
多层感知机
重绘方法
文本编码器
对象
图像分割模型
噪声
计算机程序产品
中间层
强度
语义特征
编码模块
网络