一种文本生成图像的方法、系统、存储介质和程序产品

正文

推荐专利

申请号：CN202411581532

申请日期：2024-11-06

公开号：CN119478136A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供一种文本生成图像的方法、系统、存储介质和程序产品，方法包括：对给定的待形变图像和给定的训练目标图像进行编码；对给定的文本输入进行编码；利用图像关键点提取方法，获得待形变图像和训练目标图像的图像关键点集合；利用薄板样条差值方法，获得图像关键点的变化方向；将图像关键点的变化方向和文本编码，拼接到待形变图像的编码，进行扩散模型的加噪操作；利用扩散模型的去噪操作，获得去噪后的图片编码；将去噪后的图片编码，利用可训练的解码器进行图像生成；利用生成的图像和给定的训练目标图像组成损失函数，训练解码器网络，获得薄板样条差值引导的文生图模型。本发明能够在保持位置合理性的情况下生成丰富的图像。

技术关键词

文本生成图像薄板样条关键点编码解码器差值方法训练图像模型图片多层感知机预训练模型计算机程序产品处理器计算机系统网络矩阵可读存储介质多模态

一种文本生成图像的方法、系统、存储介质和程序产品

站点导航

APP 下载