摘要
一种方法,包括接收描述图像的期望特性的提示。该方法进一步包括使用编码模型集基于提示生成提示编码。该方法进一步包括使用扩散变换器模型中的第一变换器区块,基于提示编码与噪声输入生成第一提示嵌入和第一图像嵌入。该方法进一步包括使用扩散变换器模型中的第二变换器区块,基于第一图像嵌入和第一提示嵌入生成第二图像嵌入。该方法进一步包括基于第二图像嵌入生成该图像。
技术关键词
图像嵌入
变换器
文本编码器
可读存储介质
计算机
人工智能模型
噪声像素
图像编码器
生成噪声
指令
注意力
处理器
尺寸
矫正
线性