一种基于光流信息的扩散模型视频生成方法

正文

推荐专利

一种基于光流信息的扩散模型视频生成方法

申请号：CN202411503462

申请日期：2024-10-25

公开号：CN119762632B

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于光流信息的扩散模型视频生成方法。首先对现有数据集中的视频进行预处理，获取参考图像信息和光流信息；然后使用标准Stable Diffusion模型作为视频生成的主干网络；使用两个与标准SD模型中Unet结构相同的Unet分别提取参考图像特征和光流特征，参考图像特征在自注意力层与SD模型Unet的自注意力层进行融合，光流特征在交叉注意力层和SD模型Unet的时序注意力层进行融合。同时为了更好的利用光流信息，本发明提出了运动损失来进一步提高网络的生成效果。另外，本发明也采用了多样化的提示信息使得网络能够获得更加稳定的生成效果。

技术关键词

注意力视频生成方法时序光流特征噪声网络图像图片编码器输出特征光流算法运动代表序列解码器参数通道矩阵分辨率

系统为您推荐了相关专利信息

基于端到端自动驾驶大模型的驾驶行为标注方法及装置

编码向量标注方法多视角文本行车轨迹预测

基于性能感知的全局通道剪枝与YOLOv5结合的龋齿检测方法

通道剪枝深度神经网络模型输出特征参数数据

多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置

人体骨架序列学习方法无监督信息熵多模态

一种提升SPI通信波特率的电路架构及实现方法

时钟波特率数据选择器电路架构主机

基于多模态体素图像特征融合注意力的三维目标检测方法

模态特征注意力网格特征图像多模态

一种基于光流信息的扩散模型视频生成方法

站点导航

APP 下载