基于跨模态对比学习和描述增强的街景图像地理定位方法及系统

正文

推荐专利

申请号：CN202411890192

申请日期：2024-12-20

公开号：CN119964136A

公开日期：2025-05-09

类型：发明专利

摘要

本发明涉及地理定位技术领域，特别涉及一种基于跨模态对比学习和描述增强的街景图像地理定位方法及系统，利用预训练的图像编码器获取待查询街景图像视觉特征和参考图像图库特征集，利用大语言模型生成待查询街景图像的文本描述特征，并将视觉特征和文本描述特征进行融合生成待查询街景图像的查询特征集；基于查询特征集和图库特征集将待查询街景图像与参考图像对齐，以获取待查询街景图像的地理位置；其中，图像编码器在训练过程中基于街景图像样本集和参考图像样本集并使用预设跨模态对比学习损失函数对图像编码器进行训练。本发明能够解决非全景图像定位问题，提高定位过程的准确性和灵活性，在地理定位领域具有较好的应用前景。

技术关键词

图像地理定位方法街景图像编码器跨模态查询特征样本图像视觉特征图像地理定位系统文本地理定位技术对齐模块图像增强数据多层感知器可读存储介质大语言模型图像压缩定位问题

系统为您推荐了相关专利信息

一种基于多模态特征融合的加密流量威胁检测方法及装置

多模态特征融合威胁检测方法加密统计特征帝企鹅

透明视频的生成方法、装置、电子设备、存储介质和计算机程序产品

图片生成方法矩阵序列元素

基于深度学习的课堂多模态数据处理方法与系统

动态时间规整算法语义动态规划算法跨模态注意力

基于多模态数据库的金属材料智能自洽筛检方法及系统

多模态数据库金属材料特征提取网络成分含量深度学习网络

一种基于多模态多任务统一模型的图像处理方法

图像处理模型图像处理方法多任务多模态模态特征

基于跨模态对比学习和描述增强的街景图像地理定位方法及系统

站点导航

APP 下载