一种基于视频扩散模型的相机轨迹可控长视频生成方法及系统

正文

推荐专利

申请号：CN202511122233

申请日期：2025-08-12

公开号：CN120956986A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种基于视频扩散模型的相机轨迹可控长视频生成方法及系统。包括相机轨迹与初始帧准备阶段、点云构建与多视角图像生成阶段、尺度因子对齐优化阶段、相机运动先验注入与噪声初始化阶段、扩散反演生成阶段以及滑动窗口时间一致性融合阶段。本发明将三维相机轨迹建模、投影重建和扩散过程结合，显式引导视频内容生成过程对准用户设定的轨迹路径，实现了结构合理、视觉自然、时间连续的长视频生成。

技术关键词

视频生成方法轨迹可控单目深度估计滑动窗口噪声先验点云生成投影图像图像修复模型摄像机矩阵深度图阶段文本编码器三维相机噪声预测

一种基于视频扩散模型的相机轨迹可控长视频生成方法及系统

站点导航

APP 下载