摘要
本发明属于红外图像技术领域,涉及一种基于热掩膜约束的跨模态文本到红外图像生成方法,该方法包括:基于大模型构建文本‑红外图像对数据集;采用均值法确定红外图像的灰度阈值,并利用灰度阈值生成红外图像热掩膜信息作为热掩膜信息约束;训练自编码器以对红外图像进行重建;使用文本‑红外图像对数据集和时间编码作为输入,利用潜在扩散模型、自编码器和热掩膜信息约束训练得到红外图像生成模型;使用高斯噪声、文本‑红外图像对数据集中的文本和时间编码作为输入,利用红外图像生成模型生成红外图像。其有益效果是,有效提升生成红外图像的热特性表达能力,实现在无可见光输入条件下从文本生成高质量红外图像的目标。
技术关键词
图像生成方法
生成红外图像
图像生成模型
掩膜
编码器
红外图像技术
文本摘要模型
解码器
可见光图像
数据
图像组合
噪声
处理器
存储设备
可读存储介质
校正
像素
系统为您推荐了相关专利信息
图像处理方法
感兴趣
掩膜
随机噪声
图像处理装置
红外热像仪图像
识别方法
编码器
可见光图像
数据分布
多源异构大数据
三元组
多源异构数据源
实体
电子病历系统
图片
上下文特征
推荐模型训练
噪声
视频生成模型