摘要
本发明公开一种多模态融合的3D目标检测方法、装置、设备及存储介质,包括:采集当前帧的图像数据和点云数据;将历史帧的目标查询向量和可学习的全局查询向量通过自注意力机制进行融合,作为当前帧的目标查询向量;针对图像和点云的不同特性,采取不同的融合方式,获取所要融合的图像特征和点云特征;将所要融合的图像特征和所要融合的点云特征进行拼接,并输入前馈神经网络,得到更新后的当前帧的目标查询向量;基于更新后的当前帧的目标查询向量进行检测,获得当前帧的3D检测结果。本发明能够有效提升检测性能、优化效率与鲁棒性、增强跟踪与泛化能力。
技术关键词
多头注意力机制
三维场景空间
前馈神经网络
神经网络训练
图像处理
多模态
特征提取模块
分支
数据
点云特征提取
动态更新
图像特征提取
坐标
编码
程序
拼接模块
系统为您推荐了相关专利信息
外观瑕疵检测系统
实时图像
卷积神经网络深度学习模型
光照
图像处理模块
智能图像处理
参数
摄像头模组
图像特征数据
原始图像数据