摘要
本发明涉及图像内容理解领域,公开了基于地理特征提取的图像地理定位系统及方法,包括:特征提取模块,用于从多模态输入中提取视觉特征向量、GPS特征向量、文本位置描述特征向量和文本场景描述特征向量;对比学习模块,用于通过视觉特征与GPS特征、文本位置描述特征、文本场景描述特征的对比学习实现多模态特征对齐;数据集构建模块,用于融合多模态特征生成地理特征向量并构建检索向量数据集。通过采用多模态特征融合与跨模态对比学习的技术方案,达到了提升地理定位精度与泛化能力的技术效果。相较于现有技术中依赖单一模态或简单特征拼接的方案,解决了传统方法因模态信息割裂导致的语义鸿沟问题。
技术关键词
图像地理定位系统
融合多模态特征
特征提取模块
图像地理定位方法
并行处理结构
融合视觉特征
GPS特征
多模态特征融合
分布式特征
场景
文本编码器
图像编码器
检索算法
预训练模型
系统为您推荐了相关专利信息
深度学习模型
DNA甲基化预测方法
DNA序列
样本
批量
量子态
特征提取模块
识别方法
极限学习机算法
神经网络参数
健康状态预测方法
钠离子电池
优化反向传播神经网络
灰色关联度
BP神经网络
特征提取系统
深度学习模型
解码图像数据
特征提取模块
输入模块
模糊控制模块
多维特征向量
深度学习预测
梯度温控系统
深度特征提取