基于深度约束的街景视频生成方法

正文

推荐专利

基于深度约束的街景视频生成方法

申请号：CN202510989603

申请日期：2025-07-17

公开号：CN120876725A

公开日期：2025-10-31

类型：发明专利

摘要

一种基于深度约束的街景视频生成方法，属于可控视频生成技术领域。本发明针对现有深度引导的视频生成方法不能将信息有效融合，视频生成质量差的问题。包括：由街景词向量和高维相机参数向量得到街景文本嵌入；由深度图一维序列和一维噪声序列相加得到深度特征条件序列；采用ControlNet分支网络对所述街景文本嵌入和所述深度特征条件序列进行融合，得到深度控制特征；扩散模型主干网络在街景文本嵌入的引导下，将一维噪声序列与所述深度控制特征进行融合，获得噪声到一维视频序列潜空间特征的向量场；反复迭代得到所述一维视频序列潜空间特征，再经3D VAE解码器还原得到街景视频。本本发明用于生成街景视频。

技术关键词

街景视频生成方法注意力序列网络深度图平稳小波噪声分支模块离散特征相机视频生成技术参数解码器语义文本编码器

基于深度约束的街景视频生成方法

站点导航

APP 下载