一种基于跨域多模态融合编码的目标匹配方法

AITNT
正文
推荐专利
一种基于跨域多模态融合编码的目标匹配方法
申请号:CN202510767997
申请日期:2025-06-10
公开号:CN120277626B
公开日期:2025-09-05
类型:发明专利
摘要
本申请涉及一种基于跨域多模态融合编码的目标匹配方法,该方法基于多视图图像数据、激光雷达点云数据以及待检测的关键词文本数据,分别得到视觉描述符、视点描述符以及第二关键词特征向量;将视觉描述符与视点描述符融合为多视图融合3D表达特征向量;将第二关键词特征向量经过线性变换,得到第三关键词特征向量;并将多视图融合3D表达特征向量与第三关键词特征向量进行拼接,得到第一联合表达向量;将第一联合表达向量经过三层transformer编码块,输出三级联合表达向量;并在三级联合表达向量与第一关键词特征向量中找出余弦相似度最高的部分作为目标匹配结果。该方法有效实现了图像、点云、文本三种模态的深度特征融合。
技术关键词
激光雷达点云数据 关键词 描述符 数据编码 视觉 编码块 深度特征融合 图像 文本 矩阵 词向量模型 数值 切片 装备 序列
系统为您推荐了相关专利信息
1
光伏片加工设备
光伏片 工位 吸盘组件 横移模组 输送线
2
一种基于汽车模具视觉检测系统及检测方法
视觉检测系统 轮廓数据 风险评估模型 汽车模具表面 数据处理模块
3
光场图像增强方法、装置、电子设备及可读存储介质
光场图像数据 图像增强方法 神经网络模型 矩阵 图像增强装置
4
基于多尺度大核卷积双残差神经网络的超分辨率图像重建方法
残差神经网络 图像重建方法 生成超分辨率图像 多尺度 图像块
5
一种同心圆数控车削加工方法
数控车削 车削功能 工件 膨胀算法 工业相机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号