摘要
本发明提供一种风格一致图像生成方法、装置、设备及介质,方法包括:获取用于表征待生成图像内容的文本提示,文本提示包括至少两个待生成图像的文本描述;将文本提示输入至图像生成模型中,对输入的文本提示进行特征提取,以根据提取的文本特征,结合共享注意力机制,对各待生成图像对应的随机噪声张量进行逐步去噪,以生成对应各待生成图像文本且风格一致的图像集合,得到风格一致图像生成结果;其中,图像生成模型是根据图像样本序列以及图像样本序列中各图像对应的文本标签训练得到的。本发明通过模型利用共享注意力机制,捕捉其他图像的共享信息,并结合文本提示,进行逐步去噪,生成符合文本描述且风格一致的高质量图像集合。
技术关键词
图像生成模型
图像生成方法
随机噪声
文本
噪声图像
注意力机制
风格
生成图像内容
感知特征
标签特征
样本
序列
图像生成装置
处理器
存储器
电子设备
介质
系统为您推荐了相关专利信息
模版
数据处理方法
图像
对象识别模型
人体检测单元
记忆
文本生成模型
状态更新
嵌入特征
双向注意力机制
关键词
文本
大语言模型
信息处理方法
计算机程序产品