视频生成、视频生成模型的训练方法及系统

正文

推荐专利

视频生成、视频生成模型的训练方法及系统

申请号：CN202510364447

申请日期：2025-03-26

公开号：CN120235180A

公开日期：2025-07-01

类型：发明专利

摘要

本说明书实施例提供一种视频生成、视频生成模型的训练方法及系统。视频生成系统可以获得展示有数字人的形象的参考图像，并基于参考图像生成视频画面特征，还可以获得数字人待播报的目标语音，至少基于目标语音生成面部驱动特征，还可以获得数字人待执行的肢体动作，并基于肢体动作生成肢体驱动特征。进而，视频生成系统将视频画面特征、肢体驱动特征、以及面部驱动特征输入至视频生成模型，以通过视频生成模型生成目标视频，该目标视频展示的是所述数字人执行所述肢体动作并播报所述目标语音的情景。其中，所述视频生成模型被训练为：在视频生成过程中以面部驱动特征和肢体驱动特征作为条件以控制数字人的肢体动作和面部动作。

技术关键词

驱动特征视频生成模型样本面部解码单元视频生成系统语音画面眼睛图像注意力机制视频帧界面编码视频生成方法情景训练系统处理器文本

系统为您推荐了相关专利信息

基于指数幂扩散模型的癫痫脑电数据扩充方法及装置

指数噪声数据概率密度函数数据扩充方法模块

一种问答模型的评估方法、装置、设备、介质及产品

答案问答模型标签样本数据

一种头痛患者饮食管理智能推荐系统

智能推荐系统数据获取模块频率序列患者

一种基于改进yolov5的深层多尺度目标检测方法

多尺度样本特征提取能力训练集算法

具有安全防护功能的时钟同步定位装置及方法

时钟同步信号源信号识别模型隔离控制器信号处理器

视频生成、视频生成模型的训练方法及系统

站点导航

APP 下载