摘要
本公开提供了基于文本的多模态人脸生成方法及装置、设备、存储介质,属于人脸图像生成技术领域,该方法包括:基于参考图像和参考图像对应的主体掩码确定主体图像,基于主体图像确定解耦全局身份嵌入特征。参考图像为初始人脸图像。基于参考图像和参考图像对应的掩码图像确定多模态局部身份嵌入特征。多模态局部身份嵌入特征为文本嵌入类特征。基于解耦全局身份嵌入特征和多模态局部身份嵌入特征确定目标生成人脸图像。本公开提供的基于文本的多模态人脸生成方法及装置、设备、存储介质能够提高文本到人脸生成的准确性,满足实际需求。
技术关键词
嵌入特征
生成人脸图像
人脸生成方法
身份
多模态
噪声图像
人脸属性
文本
人脸图像生成技术
查询特征
面部
生成噪声
编码器
序列
标记
模型训练模块
可读存储介质
系统为您推荐了相关专利信息
模态特征
高频特征
水下图像复原方法
生成提示信息
注意力
信息解码器
隐写方法
三维模型
多模态
可微分渲染管线
无人驾驶车辆
智能控制方法
激光雷达装置
行驶车辆
多尺度特征融合
瓦斯隧道通风方法
三维地质模型
瓦斯隧道通风系统
瓦斯隧道施工
编码器