摘要
本公开提供了一种图像生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:根据噪声数据、背景图像、掩码图像和文本,确定中间特征图;其中,掩码图像包括位置信息,位置信息指示了掩码图像是否包含待生成对象;文本包括N个待生成对象的对象类别,N是大于等于1的整数;根据掩码图像中的位置信息,基于与位置信息对中间特征图进行处理,得到处理后特征图;以及根据处理后特征图,生成目标图像;其中,目标图像中的背景与背景图像一致,目标图像中前景对象的类别与文本中的对象类别一致。
技术关键词
特征值
对象
噪声数据
文本
图像生成方法
查询特征
交叉注意力机制
子模块
键特征
处理单元
图像生成装置
电子设备
处理器
人工智能技术
关系
计算机程序产品
计算机视觉