一种面向ATS基于语义驱动单幅图像下3D多目标检测方法

正文

推荐专利

申请号：CN202510116192

申请日期：2025-01-24

公开号：CN120107845A

公开日期：2025-06-06

类型：发明专利

摘要

本发明公开了一种面向ATS基于语义驱动单幅图像下3D多目标检测方法，对输入的RGB图像进行处理，提取图像中各个对象的3D边界框；生成3D对象在场景中的所有潜在2D投影；提取出描述中的关键字、短语及其语义信息，形成表示语言描述的特征信息Pt；融合对象的2D图像信息和3D几何信息以获得完整的对象表示fa；将语言描述提取到的语言特征与检测到的3D对象相关联，捕获文本和视觉模态之间的语义对应关系；根据产生的匹配分数对目标进行过滤，得到所有符合自然语言描述的目标。本发明提高了检索识别的准确性和效率，实现了更高的识别精度，显著降低了计算复杂度，能够提升跨模态检索的精度和速度，大幅提高交通事件的准确识别与定位能力。

技术关键词

对象语义图像视觉特征自然语言文本注意力机制预训练网络跨模态关键字并行工作关系补丁物体场景复杂度模块双头

系统为您推荐了相关专利信息

土地价值评估方法及装置、电子设备及计算机程序产品

土地价值评估方法计算机程序产品图像电子设备校正

一种路面3D数字化高精度扫描方法及系统

高精度扫描方法 Delaunay三角剖分高斯混合模型强化学习算法 DBSCAN聚类算法

全生命周期审核追踪系统及方法

关系网络图节点链路标识追踪方法

基于AI智能体处理药物的分子数据的系统和方法

大语言模型分子药物自然语言记忆

图像传感器设备和图像捕获系统

传感器阵列图像捕获系统图像传感器设备镜头格式

一种面向ATS基于语义驱动单幅图像下3D多目标检测方法

站点导航

APP 下载