摘要
本申请涉及图像生成领域,提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括:获取文本描述和图像信息,将所述文本描述和所述图像信息输入至多模态扩散模型;利用所述文本编码器对所述文本描述进行编码处理,得到第一特征向量,并利用所述图像编码器对所述图像信息进行编码处理,得到第二特征向量;利用所述至少一条件编码器对所述图像信息进行特征提取,得到至少一条件特征向量;将所述第一特征向量、所述第二特征向量以及所述至少一条件特征向量输入到所述扩散生成器,得到所述扩散生成器输出的目标图像。本申请可以改善现有模型生成的图像存在失真和模糊问题,提高生成图像的图像细节和真实性。
技术关键词
文本编码器
图像编码器
多语言
图像生成方法
人物特征
多模态
噪声图像
空间结构特征
图像生成装置
训练集
英语
电子设备
可读存储介质
风格
处理器
系统为您推荐了相关专利信息
卷积神经网络设计
推荐方法
多层感知器
文本编码器
节点
离散余弦变换
特征提取网络
文本编码器
图像篡改取证
高频特征
图像编码器
图像实例分割方法
解码器
实例分割模型
蒸馏方法
艺术字
图像生成模型
样本
图像编码器
生成模型训练方法