基于多模态大模型的图像地理定位方法、装置及设备

正文

推荐专利

申请号：CN202411734115

申请日期：2024-11-29

公开号：CN119206385A

公开日期：2024-12-27

类型：发明专利

摘要

本发明提供一种基于多模态大模型的图像地理定位方法、装置及设备，涉及人工智能技术领域，包括：获取训练数据集，训练数据集包括多张图像；对于每一图像，对图像的GPS坐标特征进行等地球投影的GPS坐标表征以及基于随机傅里叶特征进行编码，得到图像的GPS坐标特征向量；对于每一图像，对图像进行图文协同编码，得到图像的图像特征和文本特征融合生成的协同编码特征向量；将GPS坐标特征向量和协同编码特征向量输入大模型，基于GPS坐标特征向量的嵌入和协同编码特征的嵌入相似性，对大模型进行多模态对比训练，得到训练好的大模型，将待定位图像输入训练好的大模型，输出待定位图像的经度坐标值和纬度坐标值。

技术关键词

图像地理定位方法坐标编码特征多模态文本特征向量图像特征向量前馈神经网络分层特征地理定位装置图像特征编码随机噪声编码模块图文数据文本编码器人工智能技术图像编码

系统为您推荐了相关专利信息

一种基于多摄像头数据融合的牛群密度异常预警方法

网格预警方法密度风险逻辑回归模型

基于多模态融合与深度强化学习的污水排放异常检测方法

深度强化学习模型异常检测方法时间序列特征污染物排放量交互特征

一种基于共享面板的人机融合舰船控制方法

人机周围环境信息面板时序神经网络战舰

基于多模态数据融合与知识图谱增强的智能客服机器人及其构建方法

智能客服机器人多模态数据融合知识图谱查询大语言模型非暂态计算机可读存储介质

三维对象几何属性优化方法

法线贴图图像特征信息三维模型网格模型相机

基于多模态大模型的图像地理定位方法、装置及设备

站点导航

APP 下载