摘要
本发明涉及人工智能技术领域,提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括:获取线条参考图、风格参考图和文本描述;对基于线条参考图得到的线条图像特征和基于文本描述得到的文本特征进行融合,得到图文控制特征;将图文控制特征、文本特征以及基于风格参考图得到的风格图像特征进行融合,得到图文融合特征;获取用于生成目标图像的噪声图像,并将噪声图像、线条参考图得到的结构控制特征、图文控制特征、风格图像特征以及图文融合特征输入至扩散模型进行迭代,得到扩散模型输出的目标图像。本发明可以结合多种特征不断调整和优化图像的生成,保证生成图像的质量,同时使得生成图像更加符合用户真实意图。
技术关键词
融合特征
图文
噪声图像
子模块
风格
线条
文本
图像生成方法
注意力
图像生成装置
电子设备
可读存储介质
人工智能技术
多层感知机
处理器
语义
存储器
意图
系统为您推荐了相关专利信息
综合业务系统
服务功能系统
企业认证管理
多功能移动终端
人脸识别数据库
压力识别方法
双线性插值算法
直方图均衡化算法
图像
面部
图像信息处理方法
弱监督学习
Wasserstein距离度量
深度卷积网络
房屋结构