摘要
本发明提供一种图像生成方法、装置、设备和存储介质,涉及图像处理技术领域,该方法包括:将当前文本和上一文本对应的上一图像输入图像生成模型中的自回归模块中,得到所述自回归模块输出的当前token序列;将所述上一图像输入所述图像生成模型中的图像特征适配模块中,得到所述图像特征适配模块输出的图像特征;基于所述当前token序列和所述图像特征,确定所述当前文本对应的当前图像。本发明可以提高前后生成的图像的一致性。
技术关键词
图像生成模型
图像生成方法
注意力
文本
解码器
样本
序列
图像特征提取
非暂态计算机可读存储介质
风格
图像生成装置
输入模块
处理器
图像处理技术
计算机程序产品
语义
存储器
系统为您推荐了相关专利信息
视觉特征
生成模型训练方法
概念
特征提取网络
生成方法
真实场景图像
数据生成模型
语义特征
文本
噪声数据
烹饪食材
烹饪控制方法
图像
检测网络模型
网络状态信息