摘要
本申请公开了一种图像生成方法、设备、介质及计算机程序产品,涉及人工智能技术领域,应用于预设的文生图模型,包括:利用预设文本编码器对用户输入文本进行编码得到编码向量,以移除用户输入文本中的目标内容;将编码向量输入至内容嵌入模块以生成目标文本嵌入特征,以移除编码向量中的目标内容;将目标文本嵌入特征输入至预先训练完成的用于抑制目标内容生成的文生图扩散模型以生成对应的目标图像;利用预先训练完成的二分类判别器判断目标图像中是否存在目标内容,当存在时对目标内容所在的区域生成掩膜信息,基于掩膜信息并利用预设图像矫正规则对目标图像进行矫正得到最终输出图像。
技术关键词
图像生成方法
文本编码器
嵌入特征
编码向量
样本
文本生成模型
掩膜
图像块
概念
矫正
多层感知器
计算机程序产品
数据
非易失性存储介质
锚点
蒙特卡罗方法
图像生成模型
生成提示信息