摘要
本发明提供了一种图像生成方法、装置和电子设备;其中,该方法包括:获取目标文本;其中,目标文本中包括多个实例对应的提示词;提取目标文本的文本特征,并从文本特征中提取实例相关的实例外观特征;通过预设的扩散模型,生成目标文本对应的图像特征;基于图像特征和实例外观特征,生成包含多个实例的目标图像。该方式中,目标图像的生成过程不仅受到目标文本的全局引导,还受到实例外观特征的局部引导,可以更加精确的关联特征与实例,进而提高了生成的图像中实例细节特征表达的精确性。
技术关键词
图像生成方法
计算机可执行指令
交叉注意力机制
区域位置信息
查询特征
信号
文本编码器
多层感知器
键值
图像生成装置
电子设备
处理器
可读存储介质
特征提取模块
存储器
数据
系统为您推荐了相关专利信息
调度装置
路径导航信息
标识标签
节点
初始聚类中心
双向注意力机制
图像
语义特征
跨模态
交叉注意力机制
多标签
图像生成方法
人工智能图像
中间层
注意力
外部服务调用方法
列表
数据存储
移动平均算法
计算机可执行指令
工作流框架
机器学习模型
工作流创建方法
节点
计算机可执行指令