视频生成模型训练方法、推理方法及装置

正文

推荐专利

视频生成模型训练方法、推理方法及装置

申请号：CN202411386483

申请日期：2024-09-29

公开号：CN119204107A

公开日期：2024-12-27

类型：发明专利

摘要

本发明提供一种视频生成模型训练方法、推理方法及装置，包括将标签噪声注入至由任一视频样本数据转换成的第一隐空间变量中得到第二隐空间变量；对第二隐空间变量进行时间因果交叉注意力计算和视觉交叉注意力计算，以根据计算到的第三隐空间变量确定预测噪音；根据预测噪音与标签噪声计算的损失值，优化视频生成模型的模型参数。本发明在视频生成模型的训练推理过程中，通过在注意力机制中采用时间因果交叉注意力计算和视觉交叉注意力计算，来处理隐空间变量中的数据信息和空间信息，在几乎不影响视频生成质量的前提下，大幅减少了数据计算量和搬运量，有效地提升了视频生成模型的信息处理效率。

技术关键词

视频生成模型变量推理方法视觉时序标签噪声识别推理装置解码器注意力机制数据训练装置信息处理样本处理单元参数像素

系统为您推荐了相关专利信息

一种基于区块链的人工智能样本数据溯源方法和装置

生成样本数据账本对象数据溯源方法指纹

一种采用多准则决策分析的水力旋流器多目标优化设计方法

水力旋流器多准则决策分析响应面模型综合评价指数优化设计方法

一种基于瞬态与稳态视觉诱发电位的混合脑机接口构建方法

稳态视觉诱发电位信号特征采集脑电信号独立成分分析脑机接口

基于多尺度混合图注意卷积网络癫痫发作预测方法

癫痫发作预测方法多尺度电信号序列解码器

一种超低功耗光谱加视觉传感控制系统

传感控制系统光谱传感器模块环境光照强度低功耗视觉传感器

视频生成模型训练方法、推理方法及装置

站点导航

APP 下载