文本到图像生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411380096

申请日期：2024-09-30

公开号：CN119228933A

公开日期：2024-12-31

类型：发明专利

摘要

本申请实施例属于人工智能领域，涉及一种文本到图像生成方法，包括获取随机采样的噪声向量和图像的原始文本；将噪声向量和图像的原始文本输入至预训练扩散模型中生成粗糙的图像和细致的图像；计算粗糙的图像和细致的图像的差异，并将差异作为质量指导；计算文本和图像相似性并作为语义指导；根据质量指导和语义指导对输入文本进行学习提示；将输入文本与所述学习提示连接并发送到文本编码器得到最终文本嵌入；将最终文本嵌入和随机采样的噪声向量发送到预训练的扩散模型，生成最终图像。本申请还提供一种文本到图像生成装置、计算机设备及存储介质。本申请有效地提高了文本到图像合成的准确性。

技术关键词

图像生成方法计算机可读指令文本编码器图像生成装置语义计算机设备噪声数据线性回归算法深度神经网络可读存储介质图像编码词语处理器输入模块优化器指数

文本到图像生成方法、装置、计算机设备及存储介质

站点导航

APP 下载