基于感知大模型知识蒸馏的跨视角定位提示精确编码方法

AITNT
正文
推荐专利
基于感知大模型知识蒸馏的跨视角定位提示精确编码方法
申请号:CN202510886997
申请日期:2025-06-30
公开号:CN120823264A
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了一种基于感知大模型知识蒸馏的跨视角定位提示精确编码方法。方法包括:设置基于感知大模型、编码操作和定位聚合模块的教师模型和学生模型,对模型进行知识蒸馏以嵌入语义理解先验知识,同时构建总知识蒸馏损失函数,直至收获得训练完成的定位模型;将标注有待查询的位置提示点的查询图像以及跨视角的参考图像输入定位模型中处理,从而获得待查询的位置提示点在参考图像中的坐标定位。本发明可以解决当前交互式跨视角定位模型在交互定位时,由于用户点提示语义模糊而造成的定位精度较低的问题,可以有效提升现有的交互式跨视角地理定位的定位准确性,能够提升对于用户提示的语义理解能力,从而给出更加符合用户意图的定位结果。
技术关键词
编码方法 视角 知识蒸馏方法 教师 学生 图像 语义 模块 物体 程序 处理器 坐标 可读存储介质 存储器 数据 像素点 电子设备 意图
系统为您推荐了相关专利信息
1
一种基于计算机视觉的曲轴尺寸检测方法
尺寸检测方法 轮廓特征 曲轴 计算机视觉 校正算法
2
基于多模态语义信息交互的零样本草图检索方法及其系统
草图检索方法 检索图像 语义 交互特征 学生
3
一种基于教师-学生架构的智能干扰决策方法
干扰决策方法 策略 教师 学生 定义
4
一种基于决策树的不确定性再制造调度方法
序列 代表 教师 编码 利润
5
一种生态水文模型引导的地下水超采生态修复方法
生态修复方法 大数据 实时数据 保护地下水 生态水文技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号