一种基于跨域多模态融合编码的目标匹配方法

正文

推荐专利

申请号：CN202510767997

申请日期：2025-06-10

公开号：CN120277626B

公开日期：2025-09-05

类型：发明专利

摘要

本申请涉及一种基于跨域多模态融合编码的目标匹配方法，该方法基于多视图图像数据、激光雷达点云数据以及待检测的关键词文本数据，分别得到视觉描述符、视点描述符以及第二关键词特征向量；将视觉描述符与视点描述符融合为多视图融合3D表达特征向量；将第二关键词特征向量经过线性变换，得到第三关键词特征向量；并将多视图融合3D表达特征向量与第三关键词特征向量进行拼接，得到第一联合表达向量；将第一联合表达向量经过三层transformer编码块，输出三级联合表达向量；并在三级联合表达向量与第一关键词特征向量中找出余弦相似度最高的部分作为目标匹配结果。该方法有效实现了图像、点云、文本三种模态的深度特征融合。

技术关键词

激光雷达点云数据关键词描述符数据编码视觉编码块深度特征融合图像文本矩阵词向量模型数值切片装备序列

系统为您推荐了相关专利信息

光伏片加工设备

光伏片工位吸盘组件横移模组输送线

一种基于汽车模具视觉检测系统及检测方法

视觉检测系统轮廓数据风险评估模型汽车模具表面数据处理模块

光场图像增强方法、装置、电子设备及可读存储介质

光场图像数据图像增强方法神经网络模型矩阵图像增强装置

基于多尺度大核卷积双残差神经网络的超分辨率图像重建方法

残差神经网络图像重建方法生成超分辨率图像多尺度图像块

一种同心圆数控车削加工方法

数控车削车削功能工件膨胀算法工业相机

一种基于跨域多模态融合编码的目标匹配方法

站点导航

APP 下载