虚拟人视频生成方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411462352

申请日期：2024-10-18

公开号：CN119364141A

公开日期：2025-01-24

类型：发明专利

摘要

本发明提供一种虚拟人视频生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，该方法中通过将每个视频帧中的人脸图像、遮盖图像以及语音特征一同输入至目标图像生成模型进行处理，可以使最终得到的虚拟人视频与待处理视频相比，仅虚拟人的口型发生变化，与驱动语音一致，姿态依然保持一致，可以使虚拟人形象更加逼真，提高用户的观看体验。而且，该方法中将人脸图像和遮盖图像分别进行编码，可以使人脸图像的信息得到充分应用，进而结合自注意力机制以及交叉注意力机制，将图像特征与语音特征进行融合，使人脸图像的细节保持度更高，降低虚拟人与真人的差异，提高虚拟人视频的逼真效果。

技术关键词

图像生成模型视频生成方法语音特征感知特征交叉注意力机制样本融合特征人脸图像特征非暂态计算机可读存储介质视频生成装置编码电子设备人工智能技术级联

系统为您推荐了相关专利信息

一种基于小波变换和傅里叶修正的低光图像增强方法

图像增强方法状态空间模型融合小波离散小波变换恢复器

图像生成方法、计算机终端、存储介质及程序产品

图像生成模型适配器图像生成方法边缘检测对象

一种基于双对抗学习可见光红外融合的目标检测方法

红外序列图像可见光图像特征金字塔网络检测网络模型生成器网络

一种基于声学特征的人防工程暗管渗漏定位方法

脉冲压缩技术时间反转镜渗漏定位方法声学特征时分多址技术

一种视频生成方法、设备、车辆及产品

行车记录视频车载屏幕视频生成方法智能驾驶系统机器可读指令

虚拟人视频生成方法、装置、电子设备及存储介质

站点导航

APP 下载