一种基于扩散模型的道路场景拟真视频生成方法

AITNT
正文
推荐专利
一种基于扩散模型的道路场景拟真视频生成方法
申请号:CN202411537624
申请日期:2024-10-31
公开号:CN119402721B
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于扩散模型的道路场景拟真视频生成方法,通过结合自动驾驶仿真软件合成数据方法和视频拟真算法,将仿真软件合成的内容可控视频映射为画面逼真,动态连贯的拟真视频;采用拓展自注意力模块,将视频拟真算法分解为逐帧进行的图像拟真转换过程,降低了长视频的拟真难度;使用语义分割图、深度估计图和内容描述文本的组合作为图像语义内容和空间结构的抽象表征,解耦了图像的内容和风格,在图像拟真转换过程中有效保持原图像的内容信息;采用开源的模型生成真实图像的语义分割图、深度估计图和内容描述文本作为训练数据,降低了训练数据集的构建难度。本发明的优点在于,生成的拟真视频画面逼真、动态连贯,视频内容可控。
技术关键词
视频生成方法 图像生成模型 图像生成网络 语义 真实图像数据 仿真软件 注意力 场景 随机噪声 多级特征融合 关键帧内容 序列 编码器 空间结构信息 融合特征 文本特征向量
系统为您推荐了相关专利信息
1
多模态特征嵌入的室内三维场景理解方法及终端
室内三维场景 多模态特征 融合全局特征 实例分割模型 融合特征
2
同屏器跨平台触控指令的语义解析与映射方法
映射方法 语义 指令 同屏器 事件处理机制
3
协议数据模板构造方法、系统、电子设备及存储介质
模板构造方法 大语言模型 协议 字段 变量
4
文本纠错方法、装置、计算机设备、存储介质和程序产品
纠错文本 样本 文本纠错方法 学生 纠正文本输入
5
法规的咨询方法、可读存储介质及程序产品
意图识别模型 车辆事故信息 可读存储介质 车辆行驶信息 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号