摘要
本申请涉及图像生成技术领域,提供了一种场景图像的生成方法、装置、电子设备及可读存储介质。该方法包括:通过文本编码器对文本描述信息进行处理得到第一文本特征;通过图像特征提取模块对参考图像进行处理得到全局图像特征、图像背景特征、骨架图、人物语义图像融合特征和人脸语义图像融合特征;通过人物人脸特征融合模块对第一文本特征、人物语义图像融合特征、人脸语义图像融合特征进行交叉融合,得到人物人脸融合特征;通过扩散模型,对预设噪声图和骨架图融合后的特征、全局图像特征、图像背景特征、第一文本特征和人物人脸融合特征进行处理,生成待生成对象的目标场景人物图像。解决了相关技术难以精准塑造人物个性化特征的技术问题。
技术关键词
融合特征
人脸语义
人物人脸特征
人脸身份
语义特征
图像编码器
图像特征提取
注意力
文本编码器
网络模块
采样模块
输出特征
多层感知器
生成方法
人脸特征融合
系统为您推荐了相关专利信息
特征提取模块
风险源识别
特征金字塔
识别方法
融合特征
衣物图像
分割方法
检测衣物
视频帧
特征提取模块
图像检索方法
船舶
特征提取网络
局部特征描述符
Softmax函数