视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法

正文

推荐专利

申请号：CN202510829074

申请日期：2025-06-19

公开号：CN120614502A

公开日期：2025-09-09

类型：发明专利

摘要

本申请提供了一种视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法；包括：获取第一样本数据集；第一样本数据集包括第一驱动音频、第一对象的第一真值视频以及第一掩码视频；第一掩码视频是对第一真值视频中第一对象的脸部部分区域进行掩码后得到的视频；通过待训练的视频生成模型，基于第一驱动音频，对第一真值视频和第一掩码视频进行语音驱动，得到第一驱动视频；基于第一驱动音频、第一驱动视频和第一真值视频进行判别损失计算，得到视频生成模型的判别损失结果；基于判别损失结果，对视频生成模型的模型参数进行更新，得到训练后的视频生成模型。通过本申请，能够提升视频生成模型的视频生成效果。

技术关键词

视频生成模型视频生成方法计算机可执行指令图像视觉特征提取语义特征提取语音对象计算机程序产品音频特征样本可读存储介质解码模块编码模块

系统为您推荐了相关专利信息

支持多模态输入的移动端边缘智能推理方法及系统

识别区元素识别视频数据声波智能推理方法

一种基于行业大模型的野火检测方法、装置、设备及介质

野火检测转换后图像双向注意力机制图像特征数据切片

一种高空作业安全带佩戴检测的方法及系统

高空作业安全带注意力非线性神经网络输入检测系统图片

一种多模态特征数据融合的小麦氮素处方图自动生成方法

多模态特征自动生成方法归一化植被指数多尺度特征金字塔分支

基于小角X射线散射设备的自适应束斑校准方法及系统

小角X射线散射校准方法探测器滤波片蒙特卡洛

视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法

站点导航

APP 下载