摘要
本公开关于一种视频生成方法、视频生成模型的训练方法、装置和设备,属于自动驾驶、视频生成技术领域。其中,该方法包括:获取观测视角下的原始视频中的至少一帧;基于所述原始视频中的至少一帧在二维空间下图像的特征,确定对应帧在三维空间下体素的特征;基于各帧在所述三维空间下体素的特征,生成设定视角下的目标视频。由此,体素的特征保留了对象的三维信息,使得生成的设定视角下的目标视频能够保持对象原有的三维特征,即保持视觉上的一致性和真实性,在多视角视频生成场景中,有助于提高多视角视频之间的三维一致性,提高了生成的视频的质量,适用于多视角的自动驾驶视频的生成场景。
技术关键词
视角
视频生成模型
模态特征
融合特征
视频生成方法
样本
生成场景
预测特征
视频生成技术
机器人
噪声图像
处理器
编码器
特征提取方式
视频生成装置
视频播放设备
空间特征提取
注意力
系统为您推荐了相关专利信息
体积特征
机器人抓取
重建场景
三维工作空间
图像特征提取
视频生成模型
交通事故风险
视频特征向量
视频帧
文本
三维地图热力图
生成方法
地理信息数据
构建三维地图
地理坐标信息