基于多模态的场景感知方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202510714686

申请日期：2025-05-30

公开号：CN120219905B

公开日期：2025-08-29

类型：发明专利

摘要

本公开提供了一种基于多模态的场景感知方法、装置、电子设备和存储介质。本公开实施例提供的方法中，先提取多视角图像序列的图像特征和4D雷达数据序列获的雷达特征，使用历史雷达特征和当前雷达特征在BEV空间与体素空间建模动态场景与静态场景的时空演化以得到动态场景特征和静态场景特征，再针对图像特征、动态场景特征和静态场景特征进行跨模态交互融合得到多模态融合特征，该多模态融合特征可直接用于3D目标检测、语义占用预测和/或运动状态估计。本公开能够在复杂环境下实现高精度、高效率的场景理解。

技术关键词

动态场景雷达场景特征融合特征跨模态多模态场景感知方法交互特征运动状态估计图像空洞多视角特征序列多尺度特征提取模块金字塔池化金字塔特征轻量级卷积神经网络时序

系统为您推荐了相关专利信息

一种应用于高中压阀门的智能监控方法及系统

高中压工作特征检修计划孤立森林算法智能监控方法

一种基于多尺度金字塔的轻量化半监督视频对象分割方法

金字塔结构多尺度记忆交叉注意力机制更新模型参数

一种用于无人驾驶AVP场景的停车场导航路网生成方法

路网生成方法停车场障碍物停车位电子地图数据

一种喉气管狭窄自动评估系统及方法

自动评估系统中心线自动评估方法图像特征提取模块

一种运动与外观解耦的多尺度交互与语义校准视频摘要方法

视频摘要方法运动特征特征金字塔融合特征语义向量

基于多模态的场景感知方法、装置、电子设备和存储介质

站点导航

APP 下载