基于结构化时空稀疏性的快速视频生成方法及系统

正文

推荐专利

申请号：CN202510891433

申请日期：2025-06-30

公开号：CN120782900A

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于结构化时空稀疏性的快速视频生成方法及系统，属于计算机视觉与人工智能领域。本发明系统性分析揭示了视频扩散模型中注意力矩阵所固有的结构化且异构的稀疏模式，其核心在于：1)自适应分块策略，通过动态的图块分组来近似多样的空间交互模式；2)时序变化的窗口，根据帧间距离动态调整稀疏级别；3)自动化的配置搜索算法，在保持关键注意力路径的同时优化稀疏模式。本发明通过离线预计算优化的稀疏注意力掩码，在推理阶段直接应用于注意力计算，从而在保持与全注意力基线相当的视觉质量的同时，在单GPU上实现1.8至2.5倍的注意力计算加速，为高效的长视频生成提供了全新的解决路径。

技术关键词

注意力视频生成模型视频生成方法搜索方法离线计算机电子设备视频生成系统分块策略存储计算机程序十字形计算机视觉搜索算法模式识别模块在线处理器阶段可读存储介质

系统为您推荐了相关专利信息

一种基于提示驱动和对比学习的社交媒体多模态情感分类方法

多模态情感分类方法文本融合特征样本数据

一种基于Mamba的超轻量图像分割方法及计算机装置

图像分割模型图像分割方法卷积模块并行视觉通道注意力机制

一种基于图卷积网络的方面级情感分析方法、设备及介质

情感分析模型情感分析方法感知特征注意力卷积模块

个性化图像生成方法、装置、电子设备及存储介质

图像生成方法实例分割文本跨模态图像生成装置

基于预训练扩散模型处理受限数据的高精度姿态估计方法

高精度姿态估计方法关键点注意力噪声图像动态权重分配

基于结构化时空稀疏性的快速视频生成方法及系统

站点导航

APP 下载