一种基于视角信息和关系解耦的3D视觉物体定位方法

正文

推荐专利

申请号：CN202510082319

申请日期：2025-01-20

公开号：CN120125655B

公开日期：2025-12-19

类型：发明专利

摘要

本发明公开了一种基于视角信息和关系解耦的3D视觉物体定位方法，包括：获取多模态数据并进行预处理得到3D场景点云数据和文本；设计一个简单关系解耦模块，对预处理后的文本进行空间关系解耦，得到多组简化空间描述；对3D场景点云数据进行特征提取得到3D物体特征，将多组简化空间描述转化为多组空间描述特征；设计一种视角信息传递模块，将可学习的多视角标记与空间描述特征结合；设计一个跨模态解码器，处理带视角信息的空间描述特征和3D物体特征，生成用于预测的融合特征；将融合特征经过分类头进行分类预测，计算出场景中每个物体的概率，并选择最大概率的物体作为最终的定位结果。本发明可提高3D视觉物体定位的准确性和鲁棒性。

技术关键词

物体定位方法视角交叉注意力机制融合特征信息传递模块标记线性变换矩阵关系文本编码器视觉跨模态模态特征神经网络分类优化神经网络空间分布信息

系统为您推荐了相关专利信息

一种基于人工智能的河蟹性别识别方法及系统

性别识别方法注意力机制数据性别识别系统 Softmax函数

基于深度学习多模态融合的变压器故障智能检测方法、装置、计算机设备及可读存储介质

多模态故障智能检测方法检测数据输入变压器故障检测计算机设备

基于多模态特征融合与动态优化的集成电路热点检测方法

矩阵多头注意力机制多模态特征融合融合特征热点检测方法

视频处理方法、装置、可读存储介质和程序产品

视频帧深度图卷积特征提取融合特征图像分割

一种基于多模态条件扩散模型的视频异常检测方法

视频异常检测方法立方体网络模块多模态原始图像数据

一种基于视角信息和关系解耦的3D视觉物体定位方法

站点导航

APP 下载