摘要
本发明公开了基于视觉语义提示协作的泛化零样本学习方法,借助类语义信息识别可见和不可见类别的图像,其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类;包括步骤一:浅层的弱提示融合;步骤二:深层的强提示融合;步骤三:视觉提示发散损失和语义蒸馏损失优化;该方法设计视觉提示来整合内部视觉信息以进行判别特征学习,并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制,通过视觉提示和语义提示的协作,可以获得语义丰富的特征,用于广义零样本图像识别。大量实验表明,该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。
技术关键词
零样本学习方法
局部视觉特征
全局视觉特征
图像视觉特征
自然语言模型
注意力机制
蒸馏
原型
判别特征
适配器
残差信息
偏差
融合方法
语义特征
系统为您推荐了相关专利信息
图像视觉特征
嵌入特征
基准
序列
多模态特征融合
数据处理模块
交互式建模方法
自然语言模型
预测建模
指令
钙钛矿电池
钙钛矿薄膜
钙钛矿前驱体溶液
薄膜太阳能电池技术
钙钛矿太阳能电池
铁路
知识问答方法
自然语言模型
特征向量库
答案
文本识别方法
文本识别模型
视觉特征编码
矫正
多模态特征