摘要
本申请公开了一种基于三重控制文生图模型的图像生成方法及系统,方法包括:获取原始样本信息,所述原始样本信息包括提示图像、提示样本和控制条件;基于稳定扩散模型,引入若干适配器网络,构建三重控制文生图模型;基于所述三重控制文生图模型对所述原始样本信息进行语义特征生成处理,得到目标文生合成图像。本申请实施例能够充分利用控制信息提取文生图像的局部与全局的特征信息,并降低文生图模型的复杂度,进而提高文生图像的生成精度。本申请可以广泛应用于图像生成技术领域。
技术关键词
编码器模块
适配器
编码特征
特征金字塔网络
注意力
图像生成方法
多尺度
样本
输入端
文本编码器
语义特征
图像编码器
图像生成技术
图像生成系统
输出端
复杂度