一种视频生成模型的训练方法、装置、计算机设备、介质和程序产品

正文

推荐专利

申请号：CN202510168371

申请日期：2025-02-13

公开号：CN120111302A

公开日期：2025-06-06

类型：发明专利

摘要

本申请实施例公开了一种视频生成模型的训练方法、装置、计算机设备、介质和程序产品，获取第一视频样本和第一文本样本；对第一文本样本、第一视频样本进行特征提取，得到第一文本特征样本、第一视频帧特征样本和第一视频特征样本；根据第一视频帧特征样本和第一文本特征样本，得到第一融合特征样本；根据第一融合特征样本和第一视频特征样本，通过初始视频生成模型进行生成，得到预测视频样本；根据预测视频样本和第一视频样本之间的差异，调整初始视频生成模型的模型参数，得到视频生成模型。训练得到的视频生成模型能够将视频特征作为中间媒介，并对其进行解码，得到视频，从而避免了先解码为图像再转换为视频的复杂过程，提高视频的生成速度。

技术关键词

视频生成模型样本视频帧特征文本融合特征多模态对象参数特征提取模型特征提取单元计算机设备因子运动存储计算机程序双向注意力机制噪声时序可读存储介质

系统为您推荐了相关专利信息

基于联合流形对齐重构的组织病理图像分类方法及系统

融合特征图像分类模型样本组织病理学图像重构模块

一种数据驱动的承压设备损伤识别诊断方法、装置、设备及介质

承压设备识别诊断方法数据样本过采样技术

一种基于大语言模型的数据清洗转换方法及系统

数据清洗转换方法大语言模型图形用户界面访问数据输入模块数据输出模块

基于图生文大模型的视频智能剪辑方法、装置及设备

视频智能剪辑方法图像计算机程序指令标签像素点

物联网设备固件边界程序检测方法及系统

应用程序编程接口程序检测方法物联网设备固件训练样本集

一种视频生成模型的训练方法、装置、计算机设备、介质和程序产品

站点导航

APP 下载