多模态融合的3D目标检测方法、装置、设备及存储介质

AITNT
正文
推荐专利
多模态融合的3D目标检测方法、装置、设备及存储介质
申请号:CN202511369811
申请日期:2025-09-24
公开号:CN121033809A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开一种多模态融合的3D目标检测方法、装置、设备及存储介质,包括:采集当前帧的图像数据和点云数据;将历史帧的目标查询向量和可学习的全局查询向量通过自注意力机制进行融合,作为当前帧的目标查询向量;针对图像和点云的不同特性,采取不同的融合方式,获取所要融合的图像特征和点云特征;将所要融合的图像特征和所要融合的点云特征进行拼接,并输入前馈神经网络,得到更新后的当前帧的目标查询向量;基于更新后的当前帧的目标查询向量进行检测,获得当前帧的3D检测结果。本发明能够有效提升检测性能、优化效率与鲁棒性、增强跟踪与泛化能力。
技术关键词
多头注意力机制 三维场景空间 前馈神经网络 神经网络训练 图像处理 多模态 特征提取模块 分支 数据 点云特征提取 动态更新 图像特征提取 坐标 编码 程序 拼接模块
系统为您推荐了相关专利信息
1
一种基于边缘计算网关的监测传输系统
监测模块 车辆 网关 因子 视频监控录像
2
基于多模态大模型保险客服图片文本信息结构化提取方法
多模态 图片 客服 字体 联合损失函数
3
一种交直流配电网实时分布式电压控制方法及系统
交直流配电网 分片 有功功率 光伏逆变器 储能
4
基于图像语义的产品外观瑕疵检测系统和方法
外观瑕疵检测系统 实时图像 卷积神经网络深度学习模型 光照 图像处理模块
5
一种摄像头模组智能图像处理与实时识别方法
智能图像处理 参数 摄像头模组 图像特征数据 原始图像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号