摘要
本申请实施例提供了一种人像视频生成方法和装置、电子设备及存储介质,属于图像处理技术领域,适用于金融科技场景。该方法包括:获取目标对象的样本音视频;其中,样本音视频包括目标人像视频帧和样本音频;对样本音频进行音频特征提取,得到样本音频特征;根据目标人像视频帧进行头部特征提取,得到目标头部特征;根据目标人像视频帧、样本音频特征和目标头部特征对预设视频生成模型进行训练,得到目标视频生成模型;获取目标对象的目标音频,基于目标视频生成模型、目标头部特征和目标音频对目标对象进行人像视频生成。本申请实施例能够通过音频生成画面自然的人像视频。
技术关键词
视频生成模型
头部特征
运动特征
视频帧
面部关键点
视频生成方法
姿态特征
面部表情特征
音频特征提取
样本
音视频
对象
视频生成装置
电子设备
风格
模型训练模块
系统为您推荐了相关专利信息
动作识别模型
动作识别方法
视频帧
阶段
面向多模态数据
远程监测平台
监测管理平台
运动状态评估
数据管理
生理
计算机视觉
深度学习模型
分支
深度学习网络
解码网络