风格化数字人视频生成方法、电子设备和存储介质

AITNT
正文
推荐专利
风格化数字人视频生成方法、电子设备和存储介质
申请号:CN202411699073
申请日期:2024-11-26
公开号:CN119211659B
公开日期:2025-06-20
类型:发明专利
摘要
本申请提供一种风格化数字人视频生成方法、电子设备和存储介质。属于图像处理技术领域,所述方法包括:接收风格化数字人视频生成指令,风格化数字人视频生成指令包括用户照片、目标风格化类型以及配音文件;根据目标风格化类型,将用户照片转化为目标风格化图像;将目标风格化图像和配音文件输入预训练的口型驱动模型,其中,预训练好的口型驱动模型提取目标风格化图像的身份特征以及配音文件的音频特征,并根据身份特征和音频特征生成风格化数字人视频;获取预训练的口型驱动模型输出的风格化数字人视频,风格化数字人视频的口型驱动与配音文件同步。本申请还能够提供更加个性化、实时性和高质量的风格化数字人视频。
技术关键词
生成器网络 视频生成方法 训练集 语音编码器 音频特征 生成指令 风格 图像特征向量 身份 照片 卷积神经网络提取 语音特征 解码器 电子设备 处理器 图像处理技术
系统为您推荐了相关专利信息
1
基于知识蒸馏的语言模态去偏视觉问答方法
视觉问答方法 学生 教师 模态特征 蒸馏
2
一种基于MIDCN的电力负荷预测方法
卷积网络模型 电力负荷预测方法 负荷历史数据 前馈神经网络 训练集数据
3
一种城市排水管道健康状况实时监测方法
城市排水管道 实时监测方法 光纤传感器 健康状况监测 算术平均值
4
一种基于Transformer模型的纳米抗肿瘤药物设计优化方法及系统
纳米抗肿瘤药物 设计优化方法 纳米药物 训练集 前馈神经网络
5
一种基于人工智能的退行性颈脊髓病影像分析方法及系统
影像分析系统 图像分析模型 ResNet网络 影像分析方法 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号