基于文本的多模态人脸生成方法及装置、设备、存储介质

AITNT
正文
推荐专利
基于文本的多模态人脸生成方法及装置、设备、存储介质
申请号:CN202411715791
申请日期:2024-11-27
公开号:CN119722837B
公开日期:2025-07-22
类型:发明专利
摘要
本公开提供了基于文本的多模态人脸生成方法及装置、设备、存储介质,属于人脸图像生成技术领域,该方法包括:基于参考图像和参考图像对应的主体掩码确定主体图像,基于主体图像确定解耦全局身份嵌入特征。参考图像为初始人脸图像。基于参考图像和参考图像对应的掩码图像确定多模态局部身份嵌入特征。多模态局部身份嵌入特征为文本嵌入类特征。基于解耦全局身份嵌入特征和多模态局部身份嵌入特征确定目标生成人脸图像。本公开提供的基于文本的多模态人脸生成方法及装置、设备、存储介质能够提高文本到人脸生成的准确性,满足实际需求。
技术关键词
嵌入特征 生成人脸图像 人脸生成方法 身份 多模态 噪声图像 人脸属性 文本 人脸图像生成技术 查询特征 面部 生成噪声 编码器 序列 标记 模型训练模块 可读存储介质
系统为您推荐了相关专利信息
1
基于多模态视觉引导与特征分解的水下图像复原方法
模态特征 高频特征 水下图像复原方法 生成提示信息 注意力
2
一种基于多模态融合和深度学习的特种车辆焊接状态智能识别方法和识别系统
智能识别方法 焊缝缺陷 特种车辆 图像 多模态
3
基于多模态大模型和可微三维渲染的三维隐写方法
信息解码器 隐写方法 三维模型 多模态 可微分渲染管线
4
一种基于无人驾驶车辆智能控制系统及方法
无人驾驶车辆 智能控制方法 激光雷达装置 行驶车辆 多尺度特征融合
5
基于地质模拟和深度学习的瓦斯隧道通风方法及系统
瓦斯隧道通风方法 三维地质模型 瓦斯隧道通风系统 瓦斯隧道施工 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号