摘要
本发明涉及一种用于自动驾驶中的占据预测方法、系统、设备及介质,包括:获取多视角图像序列,通过二维卷积网络提取多视角图像特征,并转换为三维体素特征,投影生成当前时刻的鸟瞰图特征;将当前时刻的鸟瞰图特征输入场景记忆门模块与历史特征图进行动态融合,生成更新后的历史特征图;将更新后的历史特征图转换为三维语义特征,并与三维体素特征进行融合生成增强三维特征;对增强三维特征进行多尺度几何编码处理,生成三维几何特征;对更新后的历史特征图进行多层级语义编码处理,生成二维语义特征;将三维几何特征与二维语义特征进行融合,输出三维占据预测结果。该预测方法可以在有限的计算资源下,兼顾高精度、低参数量与实时推理。
技术关键词
双向注意力机制
二维卷积网络
门模块
输出特征
多尺度
键特征
层级
多视角图像采集
生成高分辨率
分支
语义特征提取
序列
空洞
记忆
键值
系统为您推荐了相关专利信息
缺陷识别方法
特征提取模块
金属表面缺陷
SAM模块
样本
交互注意力
分支
特征加权融合
血管分割
非易失性计算机可读存储介质