基于感知大模型知识蒸馏的跨视角定位提示精确编码方法

正文

推荐专利

申请号：CN202510886997

申请日期：2025-06-30

公开号：CN120823264A

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开了一种基于感知大模型知识蒸馏的跨视角定位提示精确编码方法。方法包括：设置基于感知大模型、编码操作和定位聚合模块的教师模型和学生模型，对模型进行知识蒸馏以嵌入语义理解先验知识，同时构建总知识蒸馏损失函数，直至收获得训练完成的定位模型；将标注有待查询的位置提示点的查询图像以及跨视角的参考图像输入定位模型中处理，从而获得待查询的位置提示点在参考图像中的坐标定位。本发明可以解决当前交互式跨视角定位模型在交互定位时，由于用户点提示语义模糊而造成的定位精度较低的问题，可以有效提升现有的交互式跨视角地理定位的定位准确性，能够提升对于用户提示的语义理解能力，从而给出更加符合用户意图的定位结果。

技术关键词

编码方法视角知识蒸馏方法教师学生图像语义模块物体程序处理器坐标可读存储介质存储器数据像素点电子设备意图

系统为您推荐了相关专利信息

一种基于计算机视觉的曲轴尺寸检测方法

尺寸检测方法轮廓特征曲轴计算机视觉校正算法

基于多模态语义信息交互的零样本草图检索方法及其系统

草图检索方法检索图像语义交互特征学生

一种基于教师-学生架构的智能干扰决策方法

干扰决策方法策略教师学生定义

一种基于决策树的不确定性再制造调度方法

序列代表教师编码利润

一种生态水文模型引导的地下水超采生态修复方法

生态修复方法大数据实时数据保护地下水生态水文技术

基于感知大模型知识蒸馏的跨视角定位提示精确编码方法

站点导航

APP 下载