摘要
本发明提供了一种图像生成方法、装置和电子设备;其中,该方法包括:获取目标文本;其中,目标文本中包括多个实例对应的提示词;提取目标文本的文本特征,并从文本特征中提取实例相关的实例外观特征;通过预设的扩散模型,生成目标文本对应的图像特征;基于图像特征和实例外观特征,生成包含多个实例的目标图像。该方式中,目标图像的生成过程不仅受到目标文本的全局引导,还受到实例外观特征的局部引导,可以更加精确的关联特征与实例,进而提高了生成的图像中实例细节特征表达的精确性。
技术关键词
图像生成方法
计算机可执行指令
交叉注意力机制
区域位置信息
查询特征
信号
文本编码器
多层感知器
键值
图像生成装置
电子设备
处理器
可读存储介质
特征提取模块
存储器
数据
系统为您推荐了相关专利信息
自动激光打码方法
区域位置信息
像素点
文本
图像
意图
计算机可执行指令
计划
大语言模型
计算机程序产品
输出特征
记忆特征
图像生成模型
深度图像生成方法
解码器
动态特征模型
形态
三维体素模型
通道
计算机可执行指令