摘要
本发明提供一种精细化对齐学习的导航模型训练方法、导航方法及装置,该精细化对齐学习的导航模型训练方法包括:对从无人机航拍图像中提取的视觉特征、语义特征和空间特征进行加权融合,得到语义网格特征;基于多项辅助预测任务根据语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;以精细化空中视觉对话导航数据集为训练样本,以视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,综合损失基于导航损失函数和多项辅助预测任务对应的损失函数确定。本发明方法通过全面融合多模态特征,提高了无人机在复杂场景中的导航精度、对齐能力和任务执行效率。
技术关键词
导航模型训练方法
无人机航拍图像
网格特征
地标对象
视觉特征
语义特征
预测无人机
实体
导航方法
数据
融合多模态特征
策略
非暂态计算机可读存储介质
时序
交叉注意力机制
轨迹
系统为您推荐了相关专利信息
视觉特征
语义分割方法
令牌
多模态特征
查询特征
配准方法
视觉特征
RANSAC算法
三维点云数据
关系
登记方法
开放式停车场
拓扑地图
视觉特征
终端模块