基于多视角跨模态匹配的位置识别模型构建方法及系统

正文

推荐专利

申请号：CN202411928910

申请日期：2024-12-25

公开号：CN119887911A

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及一种基于多视角跨模态匹配的位置识别模型构建方法及系统，涉及计算机视觉和自然语言处理技术领域，针对的问题是：传统的视觉位置识别方法在复杂环境和多视角场景下难以保持高精度，且无法有效处理自然语言描述。为了解决这一问题，本发明通过多视角图像和自然语言文本描述的结合，采用文本编码和视觉编码分别对文本和图像进行特征提取；然后，使用聚类算法对图像特征进行聚类，并将每个位置的多视角图像特征拼接成全局图像特征；最后，通过计算文本特征与图像特征的相似度，进行位置匹配。通过结合视觉和文本信息，本发明解决了传统方法在复杂场景和视角变化下的鲁棒性和准确性差的问题，可广泛应用于无人系统导航领域。

技术关键词

模型构建方法多视角跨模态视觉位置识别方法局部视觉特征图像特征编码局部图像特征学习方法模型构建系统自然语言文本场景聚类处理器计算机装置图像嵌入

系统为您推荐了相关专利信息

一种跨模态语义注意力协同增强的视频字幕生成方法及系统

视频字幕生成方法语义注意力视觉特征跨模态解码器

一种基于知识图谱推理的目标关键部位识别方法

关键部位识别方法知识图谱推理视觉特征融合特征构建知识图谱

阴道分娩并发症风险预测模型构建方法、系统、电子设备及存储介质

风险预测模型随机森林模型阴道数据变量

一种面向建筑立面缺陷诊断的三维热环境神经场重建方法及系统

双模态影像可见光相机运动恢复结构热红外相机三维模型

多视角多模态自动驾驶数据集的构建方法及装置

多模态传感器数据场景语义分割信息

基于多视角跨模态匹配的位置识别模型构建方法及系统

站点导航

APP 下载