基于文本的多模态人脸生成方法及装置、设备、存储介质

正文

推荐专利

申请号：CN202411715791

申请日期：2024-11-27

公开号：CN119722837B

公开日期：2025-07-22

类型：发明专利

摘要

本公开提供了基于文本的多模态人脸生成方法及装置、设备、存储介质，属于人脸图像生成技术领域，该方法包括：基于参考图像和参考图像对应的主体掩码确定主体图像，基于主体图像确定解耦全局身份嵌入特征。参考图像为初始人脸图像。基于参考图像和参考图像对应的掩码图像确定多模态局部身份嵌入特征。多模态局部身份嵌入特征为文本嵌入类特征。基于解耦全局身份嵌入特征和多模态局部身份嵌入特征确定目标生成人脸图像。本公开提供的基于文本的多模态人脸生成方法及装置、设备、存储介质能够提高文本到人脸生成的准确性，满足实际需求。

技术关键词

嵌入特征生成人脸图像人脸生成方法身份多模态噪声图像人脸属性文本人脸图像生成技术查询特征面部生成噪声编码器序列标记模型训练模块可读存储介质

系统为您推荐了相关专利信息

基于多模态视觉引导与特征分解的水下图像复原方法

模态特征高频特征水下图像复原方法生成提示信息注意力

一种基于多模态融合和深度学习的特种车辆焊接状态智能识别方法和识别系统

智能识别方法焊缝缺陷特种车辆图像多模态

基于多模态大模型和可微三维渲染的三维隐写方法

信息解码器隐写方法三维模型多模态可微分渲染管线

一种基于无人驾驶车辆智能控制系统及方法

无人驾驶车辆智能控制方法激光雷达装置行驶车辆多尺度特征融合

基于地质模拟和深度学习的瓦斯隧道通风方法及系统

瓦斯隧道通风方法三维地质模型瓦斯隧道通风系统瓦斯隧道施工编码器

基于文本的多模态人脸生成方法及装置、设备、存储介质

站点导航

APP 下载