风格化数字人视频生成方法、电子设备和存储介质

正文

推荐专利

申请号：CN202411699073

申请日期：2024-11-26

公开号：CN119211659B

公开日期：2025-06-20

类型：发明专利

摘要

本申请提供一种风格化数字人视频生成方法、电子设备和存储介质。属于图像处理技术领域，所述方法包括：接收风格化数字人视频生成指令，风格化数字人视频生成指令包括用户照片、目标风格化类型以及配音文件；根据目标风格化类型，将用户照片转化为目标风格化图像；将目标风格化图像和配音文件输入预训练的口型驱动模型，其中，预训练好的口型驱动模型提取目标风格化图像的身份特征以及配音文件的音频特征，并根据身份特征和音频特征生成风格化数字人视频；获取预训练的口型驱动模型输出的风格化数字人视频，风格化数字人视频的口型驱动与配音文件同步。本申请还能够提供更加个性化、实时性和高质量的风格化数字人视频。

技术关键词

生成器网络视频生成方法训练集语音编码器音频特征生成指令风格图像特征向量身份照片卷积神经网络提取语音特征解码器电子设备处理器图像处理技术

系统为您推荐了相关专利信息

基于知识蒸馏的语言模态去偏视觉问答方法

视觉问答方法学生教师模态特征蒸馏

一种基于MIDCN的电力负荷预测方法

卷积网络模型电力负荷预测方法负荷历史数据前馈神经网络训练集数据

一种城市排水管道健康状况实时监测方法

城市排水管道实时监测方法光纤传感器健康状况监测算术平均值

一种基于Transformer模型的纳米抗肿瘤药物设计优化方法及系统

纳米抗肿瘤药物设计优化方法纳米药物训练集前馈神经网络

一种基于人工智能的退行性颈脊髓病影像分析方法及系统

影像分析系统图像分析模型 ResNet网络影像分析方法标签

风格化数字人视频生成方法、电子设备和存储介质

站点导航

APP 下载