一种基于扩散模型的道路场景拟真视频生成方法

正文

推荐专利

申请号：CN202411537624

申请日期：2024-10-31

公开号：CN119402721B

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于扩散模型的道路场景拟真视频生成方法，通过结合自动驾驶仿真软件合成数据方法和视频拟真算法，将仿真软件合成的内容可控视频映射为画面逼真，动态连贯的拟真视频；采用拓展自注意力模块，将视频拟真算法分解为逐帧进行的图像拟真转换过程，降低了长视频的拟真难度；使用语义分割图、深度估计图和内容描述文本的组合作为图像语义内容和空间结构的抽象表征，解耦了图像的内容和风格，在图像拟真转换过程中有效保持原图像的内容信息；采用开源的模型生成真实图像的语义分割图、深度估计图和内容描述文本作为训练数据，降低了训练数据集的构建难度。本发明的优点在于，生成的拟真视频画面逼真、动态连贯，视频内容可控。

技术关键词

视频生成方法图像生成模型图像生成网络语义真实图像数据仿真软件注意力场景随机噪声多级特征融合关键帧内容序列编码器空间结构信息融合特征文本特征向量

系统为您推荐了相关专利信息

多模态特征嵌入的室内三维场景理解方法及终端

室内三维场景多模态特征融合全局特征实例分割模型融合特征

同屏器跨平台触控指令的语义解析与映射方法

映射方法语义指令同屏器事件处理机制

协议数据模板构造方法、系统、电子设备及存储介质

模板构造方法大语言模型协议字段变量

文本纠错方法、装置、计算机设备、存储介质和程序产品

纠错文本样本文本纠错方法学生纠正文本输入

法规的咨询方法、可读存储介质及程序产品

意图识别模型车辆事故信息可读存储介质车辆行驶信息场景

一种基于扩散模型的道路场景拟真视频生成方法

站点导航

APP 下载