摘要
本申请提供一种风格化数字人视频生成方法、电子设备和存储介质。属于图像处理技术领域,所述方法包括:接收风格化数字人视频生成指令,风格化数字人视频生成指令包括用户照片、目标风格化类型以及配音文件;根据目标风格化类型,将用户照片转化为目标风格化图像;将目标风格化图像和配音文件输入预训练的口型驱动模型,其中,预训练好的口型驱动模型提取目标风格化图像的身份特征以及配音文件的音频特征,并根据身份特征和音频特征生成风格化数字人视频;获取预训练的口型驱动模型输出的风格化数字人视频,风格化数字人视频的口型驱动与配音文件同步。本申请还能够提供更加个性化、实时性和高质量的风格化数字人视频。
技术关键词
生成器网络
视频生成方法
训练集
语音编码器
音频特征
生成指令
风格
图像特征向量
身份
照片
卷积神经网络提取
语音特征
解码器
电子设备
处理器
图像处理技术
系统为您推荐了相关专利信息
卷积网络模型
电力负荷预测方法
负荷历史数据
前馈神经网络
训练集数据
城市排水管道
实时监测方法
光纤传感器
健康状况监测
算术平均值
纳米抗肿瘤药物
设计优化方法
纳米药物
训练集
前馈神经网络
影像分析系统
图像分析模型
ResNet网络
影像分析方法
标签