基于多视角跨模态匹配的位置识别模型构建方法及系统

AITNT
正文
推荐专利
基于多视角跨模态匹配的位置识别模型构建方法及系统
申请号:CN202411928910
申请日期:2024-12-25
公开号:CN119887911A
公开日期:2025-04-25
类型:发明专利
摘要
本发明涉及一种基于多视角跨模态匹配的位置识别模型构建方法及系统,涉及计算机视觉和自然语言处理技术领域,针对的问题是:传统的视觉位置识别方法在复杂环境和多视角场景下难以保持高精度,且无法有效处理自然语言描述。为了解决这一问题,本发明通过多视角图像和自然语言文本描述的结合,采用文本编码和视觉编码分别对文本和图像进行特征提取;然后,使用聚类算法对图像特征进行聚类,并将每个位置的多视角图像特征拼接成全局图像特征;最后,通过计算文本特征与图像特征的相似度,进行位置匹配。通过结合视觉和文本信息,本发明解决了传统方法在复杂场景和视角变化下的鲁棒性和准确性差的问题,可广泛应用于无人系统导航领域。
技术关键词
模型构建方法 多视角 跨模态 视觉位置识别方法 局部视觉特征 图像特征编码 局部图像特征 学习方法 模型构建系统 自然语言文本 场景 聚类 处理器 计算机装置 图像嵌入
系统为您推荐了相关专利信息
1
一种跨模态语义注意力协同增强的视频字幕生成方法及系统
视频字幕生成方法 语义注意力 视觉特征 跨模态 解码器
2
一种基于知识图谱推理的目标关键部位识别方法
关键部位识别方法 知识图谱推理 视觉特征 融合特征 构建知识图谱
3
阴道分娩并发症风险预测模型构建方法、系统、电子设备及存储介质
风险预测模型 随机森林模型 阴道 数据 变量
4
一种面向建筑立面缺陷诊断的三维热环境神经场重建方法及系统
双模态影像 可见光相机 运动恢复结构 热红外相机 三维模型
5
多视角多模态自动驾驶数据集的构建方法及装置
多模态 传感器 数据 场景 语义分割信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号