摘要
本发明公开了基于扩散模型的视频生成方法、装置以及设备,包括:得到若干张抽帧图片;构建出若干个图片组;将初始数据空间中的图片组映射至隐空间;构建待训练扩散模型;为图片组中的每个隐变量添加噪声;将图片组输入待训练扩散模型中,得到每个图片组对应的若干个预测噪声和若干个预测图片差异,以及若干个图片组之间对应的预测图片组差异;根据若干个预测噪声、若干个预测图片差异以及若干个预测图片组差异,对待训练扩散模型的神经网络参数进行调节,并在当满足预设训练要求时,将待训练扩散模型作为目标扩散模型。本发明属于视频预测领域。本发明可以使基于扩散模型预测得到的视频保持时间一致性。
技术关键词
图片
视频生成方法
神经网络参数
噪声
变量
视频生成装置
模块
数据
像素
处理器
电子设备
存储器
编码
指令
系统为您推荐了相关专利信息
实训平台
个性化路径推荐
社交互动分析
个性化学习路径
噪声数据
特征提取网络
注意力机制
盲道
模型训练模块
数据
充电芯片
低成本
图像采集电路
陶瓷天线
主控芯片
信息提取系统
卷积网络模型
AI机器人
视频
图片