摘要
本申请涉及自动驾驶技术领域,特别涉及一种纯视觉的4D占据预测方法、装置、设备及介质。所述方法通过特征提取模块提取每帧多视角图像的二维图像特征;通过三维时空建模分支基于二维图像特征确定未来多帧初始时空特征;通过二维语义时空建模分支基于二维图像特征确定多帧细化图像特征;通过时空交互模块基于多帧细化图像特征与未来三维时序特征确定分层时序特征;通过三维时空建模分支基于未来多帧时空特征确定未来多帧3D占用结果。本申请建模多视角视频帧在不同时间戳下融合3D特征的时空关联,利用所述多帧细化图像特征对初始分层时序特征以进行跨维度时空特征交互,显著增强了4D占用预测效果。
技术关键词
时序特征
二维图像特征
特征提取模块
分支
语义
分层
视觉
计算机可读程序
多视角
预测装置
编码模块
自动驾驶技术
可读存储介质
控制模块
处理器
终端设备
上采样
系统为您推荐了相关专利信息
二维超声图像
三维医学影像
模型配准方法
三维模型特征
二维图像特征
配置生成方法
强化学习网络
数字孪生系统
策略
强化学习算法