人像视频生成方法和装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411692240

申请日期：2024-11-22

公开号：CN119583906A

公开日期：2025-03-07

类型：发明专利

摘要

本申请实施例提供了一种人像视频生成方法和装置、电子设备及存储介质，属于图像处理技术领域，适用于金融科技场景。该方法包括：获取目标对象的样本音视频；其中，样本音视频包括目标人像视频帧和样本音频；对样本音频进行音频特征提取，得到样本音频特征；根据目标人像视频帧进行头部特征提取，得到目标头部特征；根据目标人像视频帧、样本音频特征和目标头部特征对预设视频生成模型进行训练，得到目标视频生成模型；获取目标对象的目标音频，基于目标视频生成模型、目标头部特征和目标音频对目标对象进行人像视频生成。本申请实施例能够通过音频生成画面自然的人像视频。

技术关键词

视频生成模型头部特征运动特征视频帧面部关键点视频生成方法姿态特征面部表情特征音频特征提取样本音视频对象视频生成装置电子设备风格模型训练模块

系统为您推荐了相关专利信息

一种面向多模态视频的全流程动作识别方法

动作识别模型动作识别方法视频帧阶段面向多模态数据

一种骨科患者数据管理与远程监测平台

远程监测平台监测管理平台运动状态评估数据管理生理

一种基于深度学习网络的图像处理方法和深度学习网络

计算机视觉深度学习模型分支深度学习网络解码网络

运动特征预测方法、装置、设备及自动驾驶车辆

上下文特征交通状态参数运动特征注意力时序

一种改进YOLOv8的工地危险区识别方法及系统

危险区识别方法特征提取模块报警系统图像

人像视频生成方法和装置、电子设备及存储介质

站点导航

APP 下载