图像生成方法、装置、电子设备及可读存储介质

正文

推荐专利

申请号：CN202410772854

申请日期：2024-06-14

公开号：CN118736038A

公开日期：2024-10-01

类型：发明专利

摘要

本申请涉及图像生成领域，提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括：获取文本描述和图像信息，将所述文本描述和所述图像信息输入至多模态扩散模型；利用所述文本编码器对所述文本描述进行编码处理，得到第一特征向量，并利用所述图像编码器对所述图像信息进行编码处理，得到第二特征向量；利用所述至少一条件编码器对所述图像信息进行特征提取，得到至少一条件特征向量；将所述第一特征向量、所述第二特征向量以及所述至少一条件特征向量输入到所述扩散生成器，得到所述扩散生成器输出的目标图像。本申请可以改善现有模型生成的图像存在失真和模糊问题，提高生成图像的图像细节和真实性。

技术关键词

文本编码器图像编码器多语言图像生成方法人物特征多模态噪声图像空间结构特征图像生成装置训练集英语电子设备可读存储介质风格处理器

系统为您推荐了相关专利信息

一种在线招聘互惠双边推荐方法、系统及介质

卷积神经网络设计推荐方法多层感知器文本编码器节点

基于CLIP模型的图像伪造检测方法及设备

离散余弦变换特征提取网络文本编码器图像篡改取证高频特征

一种基于轻量化SAM的图像实例分割方法及装置

图像编码器图像实例分割方法解码器实例分割模型蒸馏方法

一种针对长期学习的辅导对话生成系统及方法

对话生成系统大语言模型学生记忆教师

图像生成方法以及装置

艺术字图像生成模型样本图像编码器生成模型训练方法

图像生成方法、装置、电子设备及可读存储介质

站点导航

APP 下载