基于视觉语义提示协作的泛化零样本学习方法

正文

推荐专利

申请号：CN202411743524

申请日期：2024-11-30

公开号：CN119580001A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了基于视觉语义提示协作的泛化零样本学习方法，借助类语义信息识别可见和不可见类别的图像，其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类；包括步骤一：浅层的弱提示融合；步骤二：深层的强提示融合；步骤三：视觉提示发散损失和语义蒸馏损失优化；该方法设计视觉提示来整合内部视觉信息以进行判别特征学习，并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制，通过视觉提示和语义提示的协作，可以获得语义丰富的特征，用于广义零样本图像识别。大量实验表明，该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。

技术关键词

零样本学习方法局部视觉特征全局视觉特征图像视觉特征自然语言模型注意力机制蒸馏原型判别特征适配器残差信息偏差融合方法语义特征

系统为您推荐了相关专利信息

一种用于RNA序列下游任务的基准模型DRFORMER

图像视觉特征嵌入特征基准序列多模态特征融合

基于大模型的交互式建模方法、装置、设备及存储介质

数据处理模块交互式建模方法自然语言模型预测建模指令

一种利用机器学习预测中间相辅助钙钛矿相纯化的方法和钙钛矿电池

钙钛矿电池钙钛矿薄膜钙钛矿前驱体溶液薄膜太阳能电池技术钙钛矿太阳能电池

基于自然语言模型的铁路知识问答方法和装置

铁路知识问答方法自然语言模型特征向量库答案

文本识别方法、装置、可读介质、电子设备及程序产品

文本识别方法文本识别模型视觉特征编码矫正多模态特征

基于视觉语义提示协作的泛化零样本学习方法

站点导航

APP 下载