基于扩散模型的动态场景重运镜视频生成方法和系统

正文

推荐专利

申请号：CN202510942086

申请日期：2025-07-09

公开号：CN120876684A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了基于扩散模型的动态场景重运镜视频生成方法和系统，属于计算机视觉与视频生成技术领域。采用一个带控制分支的扩散生成架构，核心由嵌入层、一个主分支和一个控制分支组成。在控制分支中，每个子块的输出经过零初始线性层处理后会与主分支对应块的输出相加，其和再输入主分支的下一个块。训练时，利用同一场景下目标视频和参考视频生成渲染视频；将加噪后的目标视频潜变量输入控制分支，而目标视频、参考视频及渲染视频潜变量的拼接结果输入主分支，同时向两分支提供参考视频的文本潜变量作为条件。生成时，模型通过逐步去噪最终生成目标视频潜变量并解码为目标轨迹视频，确保生成视频与参考视频在相同时间下场景中运动物体动作一致。

技术关键词

动态场景视频生成方法分支相机轨迹动态物体点云文本深度图噪声变量获取方法视频生成技术视频生成系统关键帧视频生成模型像素点深度值阶段

系统为您推荐了相关专利信息

基于区块链的无人机飞行数据安全存储系统

数据安全存储系统无人机飞行数据信息处理数据验证星际文件系统

一种用于无人搬运车的碰撞预警方法

无人搬运车人脸识别数据库碰撞预警方法实时位置障碍物

一种基于人工智能的园区门禁管控系统及方法

门禁管控系统碳排放测算模型车牌识别模型车辆字符识别

一种多元成像镜片轮廓检测与校正装置

校正装置光源模块数据处理模块成像镜片

三维环境建模方法、装置、存储介质及程序产品

三维点云数据栅格地图三维环境模型三维环境建模方法计算机执行指令

基于扩散模型的动态场景重运镜视频生成方法和系统

站点导航

APP 下载