摘要
本发明提供了一种基于扩散模型的视频生成方法,基于虚拟引擎物理数据生成模块进行物理场景模拟,生成物理场景数据输入多模态物理表征学习模块进行物理一致性预训练,得到联合物理表征向量、预训练后的扩散模型和预训练损失值输入物理强化学习框架对预训练后的扩散模型进行训练,得到训练后的扩散模型,并将物理场景数据输入训练后的扩散模型进行视频生成,得到与物理场景数据中的物理文本描述对应的视频输入物理一致性评估模块进行评估,得到评估结果输入物理强化学习框架对扩散模型进行更新,得到物理一致性视频生成模型;将目标文本数据输入物理一致性视频生成模型进行视频生成,得到与目标文本数据对应的视频,提升了视频生成的物理一致性。
技术关键词
视频生成方法
强化学习框架
视频生成模型
场景
文本
拉丁超立方采样
数据
多模态
参数
物理特征提取
交叉注意力机制
表达式
模块
基础
决策
控制权
逻辑
系统为您推荐了相关专利信息
分布式光伏接入配电网
电网稳态模型
电力系统分析软件
电压越限
暂态稳定分析
数据识别方法
语义
文本特征向量
文本编码器
样本
风险评估模型
时间卷积网络
生成方法
多维度特征提取
深度强化学习