视频生成模型训练方法、推理方法及装置

AITNT
正文
推荐专利
视频生成模型训练方法、推理方法及装置
申请号:CN202411386483
申请日期:2024-09-29
公开号:CN119204107A
公开日期:2024-12-27
类型:发明专利
摘要
本发明提供一种视频生成模型训练方法、推理方法及装置,包括将标签噪声注入至由任一视频样本数据转换成的第一隐空间变量中得到第二隐空间变量;对第二隐空间变量进行时间因果交叉注意力计算和视觉交叉注意力计算,以根据计算到的第三隐空间变量确定预测噪音;根据预测噪音与标签噪声计算的损失值,优化视频生成模型的模型参数。本发明在视频生成模型的训练推理过程中,通过在注意力机制中采用时间因果交叉注意力计算和视觉交叉注意力计算,来处理隐空间变量中的数据信息和空间信息,在几乎不影响视频生成质量的前提下,大幅减少了数据计算量和搬运量,有效地提升了视频生成模型的信息处理效率。
技术关键词
视频生成模型 变量 推理方法 视觉 时序 标签 噪声识别 推理装置 解码器 注意力机制 数据 训练装置 信息处理 样本 处理单元 参数 像素
系统为您推荐了相关专利信息
1
一种基于区块链的人工智能样本数据溯源方法和装置
生成样本数据 账本 对象 数据溯源方法 指纹
2
一种采用多准则决策分析的水力旋流器多目标优化设计方法
水力旋流器 多准则决策分析 响应面模型 综合评价指数 优化设计方法
3
一种基于瞬态与稳态视觉诱发电位的混合脑机接口构建方法
稳态视觉诱发电位 信号特征 采集脑电信号 独立成分分析 脑机接口
4
基于多尺度混合图注意卷积网络癫痫发作预测方法
癫痫发作预测方法 多尺度 电信号 序列 解码器
5
一种超低功耗光谱加视觉传感控制系统
传感控制系统 光谱传感器模块 环境光照强度 低功耗 视觉传感器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号