摘要
本申请实施例公开了图像生成方法及电子设备,所述方法包括:接收用户发起的生成图像内容的请求;获得所述用户指定的多张参考图,并确定所述多张参考图分别对应的控制维度;利用图像生成模型对所述请求进行处理,以生成图像内容;其中,在生成图像内容的过程中,分别根据所述多张参考图进行特征提取,并分别利用控制模型在对应的控制维度上生成控制条件后,基于交叉注意力机制将所提取出的特征以及生成的控制条件注入到所述图像生成模型的生成网络中,以使得多张参考图分别在对应的控制维度上发挥作用,并共同控制图像内容的生成。通过本申请实施例,能够在不依赖于用户对提示词写法的背景知识的情况下,生产出符合用户预期的图像。
技术关键词
图像生成模型
生成图像内容
交叉注意力机制
图像生成方法
文本
计算机可执行指令
电子设备
存储程序指令
处理器
网络
计算机程序产品
编辑
语义
可读存储介质
多模态
存储器
编码
元素
系统为您推荐了相关专利信息
语义特征
转换编码器
嵌入特征
声学特征
重构模型
检测识别方法
互补性特征
检测网络模型
融合特征
视觉特征
个性化学习方法
学习路径规划方法
遮挡识别方法
答题
图谱