摘要
本申请涉及图像生成技术领域,提供了一种风格图像的生成方法、装置、电子设备及可读存储介质。该方法包括:通过线稿特征提取模块对结构参考图像进行处理,得到结构参考图像的线稿控制特征;通过风格特征提取模块对风格参考图像进行处理,得到风格参考图像的多尺度风格融合特征;通过文本编码器对文本描述信息进行处理,得到文本描述信息的文本特征;通过文本风格融合模块对多尺度风格融合特征和文本特征进行融合,得到文本风格融合特征;通过扩散模型基于预设噪声图,对线稿控制特征、文本特征和文本风格融合特征进行处理,生成待生成对象的目标风格图像。解决了现有方法难以生成高质量的目标风格图像的问题。
技术关键词
风格
融合特征
特征提取模块
图像编码器
语义特征提取
图像特征提取
多层感知机
注意力
文本编码器
图像拼接
多尺度
网络模块
生成方法
图像生成技术
输出特征
系统为您推荐了相关专利信息
可见光图像
设备缺陷检测
多模态
融合特征
性能预测模型
特征提取模型
神经网络参数
训练样本集
矿山生态环境
生成对抗网络
风险传播模型
监测站
水利监测系统
时序特征
水文时序数据
无人机场景
道路分割方法
卷积模块
语义地图
融合特征