基于伪标签的无监督视觉定位系统

正文

推荐专利

基于伪标签的无监督视觉定位系统

申请号：CN202411019001

申请日期：2024-07-29

公开号：CN119006779A

公开日期：2024-11-22

类型：发明专利

摘要

本发明属于图像处理技术领域，具体为基于伪标签的无监督视觉定位系统。本发明包括区域提议生成模块、区域描述生成模块、查询构建模块;区域提议生成模块通过预训练的目标检测器识别图像中可能存在的实体区域、类别及其置信度，通过类别偏置消除器解决置信度在类别分布的不均匀问题;区域描述生成模块利用多模态大语言模型的跨模态知识生成区域提议的描述，通过描述矫正器修正错误描述;查询构建模块通过修饰树和提示语模板构建查询。本发明利用预训练的目标检测器和多模态大语言模型蕴含的跨模态知识，构建开放词汇的视觉定位伪标签，可显著提升视觉定位的准确率。

技术关键词

视觉定位系统实体大语言模型矫正器检测器多模态模块标签构建海量同义词结点图像处理技术模板代表定义互联网数据坐标

系统为您推荐了相关专利信息

基于大语言模型的切卷一体机故障诊断方法及系统

大语言模型故障诊断方法优化器词典知识图谱构建

一种基于垂直联邦学习的配电网络虚假数据注入攻击检测方法

攻击检测方法配电网络网格 LSTM模型数据

一种基于胶原酶浸润策略的纳米药物制备及其在深位肿瘤化疗-免疫协同治疗中的应用

纳米药物抗肿瘤免疫应答化疗药物毒副作用超滤膜截留分子量蛋白质二级结构

基于云原生技术的多集群互联方法及系统、存储介质、计算机设备

BGP路由器网络管理平台数据发送对象原生技术物理

问答语料生成方法、装置及相关设备

问答语料生成方法文本大语言模型层级摘要

基于伪标签的无监督视觉定位系统

站点导航

APP 下载