视频生成模型训练方法、装置、设备、介质和产品

正文

推荐专利

申请号：CN202411972861

申请日期：2024-12-30

公开号：CN119815146A

公开日期：2025-04-11

类型：发明专利

摘要

本发明实施例公开了一种视频生成模型训练方法、装置、设备和介质，其中，方法包括：将视频样本输入到经过预训练的空间变分自动编码器进行空间编码，得到视频空间编码结果；将视频空间编码结果输入到经过预训练的时间变分自动编码器进行时间编码，得到视频时空编码结果；基于视频时空编码结果对待训练视频生成模型进行训练，得到目标视频生成模型；其中，待训练视频生成模型为扩散模型。本发明实施例的技术方案解决了目前视频生成模型训练计算负荷大的问题，可以在模型训练时在空间和时间维度上对视频样本进行编码，减少模型训练过程中的计算资源需求量，提高模型训练效率。

技术关键词

视频生成模型变分自动编码器编码特征视频解码视频编码编码模块编码器训练样本计算机设备模型训练模块处理器计算机程序产品噪声注意力机制训练装置数据可读存储介质

视频生成模型训练方法、装置、设备、介质和产品

站点导航

APP 下载