语音驱动人脸视频生成方法、系统、存储介质和电子设备

正文

推荐专利

申请号：CN202411063361

申请日期：2024-08-05

公开号：CN118969008B

公开日期：2025-09-26

类型：发明专利

摘要

本申请提供一种语音驱动人脸视频生成方法，包括：获取语音数据，提取语音数据的音频特征；将音频特征、背景图像和采样点输入至人脸生成模型，利用人脸生成模型生成每帧语音对应的人脸说话图像；将人脸说话图像拼接成视频，并叠加语音数据，得到语音驱动人脸视频生成视频。本申请无需对背景图像独立进行三维建模，同时可大大减少计算量，降低渲染的硬件成本，从而满足应用场景下对实时性、低成本的需求。本申请还提供一种语音驱动人脸视频生成系统、存储介质和电子设备，具有上述有益效果。

技术关键词

视频生成方法语音生成对抗模型视频生成系统采样点编码图像拼接人脸姿态射线相机外参嵌入特征风格人脸图像提取音频特征提取关键点三维位置信息

系统为您推荐了相关专利信息

一种新能源汽车语音功能测试方法、系统及设备

语音控制指令语音功能测试方法车机系统新能源汽车功能测试系统

一种沉浸式纸影表演AR交互系统

手势识别网络输出特征 AR交互系统手势识别模块语音识别模块

一种储能系统充放电时段调整优化方法、介质及系统

储能系统充放电三相平衡功率三相不平衡度储能系统荷电状态

语音合成方法、语音合成装置、电子设备及存储介质

文本模型更新频谱特征字符语音特征

语音合成方法、模型训练方法及相关装置

文本样本变量模型训练方法编码器

语音驱动人脸视频生成方法、系统、存储介质和电子设备

站点导航

APP 下载