摘要
本公开的实施例涉及实时的基于文本解纠缠的真实图像编辑。一种用于图像处理的方法、装置、非暂时性计算机可读介质和系统包括:获取描绘第一元素的输入图像、输入图像的文本描述以及描述第二元素的修改提示,第二元素与第一元素不同;基于输入图像和文本描述,生成中间输出,其中中间输出表示第一元素;以及基于中间输出和修改提示,生成合成图像,其中合成图像利用来自修改提示的第二元素替换来自输入图像的第一元素。
技术关键词
反演模型
图像生成模型
文本
元素
重构
非暂时性计算机可读介质
训练机器学习模型
训练集
存储器
噪声
参数
图像处理
编辑