摘要
本发明公开了一种基于感知大模型知识蒸馏的跨视角定位提示精确编码方法。方法包括:设置基于感知大模型、编码操作和定位聚合模块的教师模型和学生模型,对模型进行知识蒸馏以嵌入语义理解先验知识,同时构建总知识蒸馏损失函数,直至收获得训练完成的定位模型;将标注有待查询的位置提示点的查询图像以及跨视角的参考图像输入定位模型中处理,从而获得待查询的位置提示点在参考图像中的坐标定位。本发明可以解决当前交互式跨视角定位模型在交互定位时,由于用户点提示语义模糊而造成的定位精度较低的问题,可以有效提升现有的交互式跨视角地理定位的定位准确性,能够提升对于用户提示的语义理解能力,从而给出更加符合用户意图的定位结果。
技术关键词
编码方法
视角
知识蒸馏方法
教师
学生
图像
语义
模块
物体
程序
处理器
坐标
可读存储介质
存储器
数据
像素点
电子设备
意图
系统为您推荐了相关专利信息
尺寸检测方法
轮廓特征
曲轴
计算机视觉
校正算法
生态修复方法
大数据
实时数据
保护地下水
生态水文技术