摘要
本发明公开了基于视觉语义提示协作的泛化零样本学习方法,借助类语义信息识别可见和不可见类别的图像,其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类;包括步骤一:浅层的弱提示融合;步骤二:深层的强提示融合;步骤三:视觉提示发散损失和语义蒸馏损失优化;该方法设计视觉提示来整合内部视觉信息以进行判别特征学习,并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制,通过视觉提示和语义提示的协作,可以获得语义丰富的特征,用于广义零样本图像识别。大量实验表明,该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。
技术关键词
零样本学习方法
局部视觉特征
全局视觉特征
图像视觉特征
自然语言模型
注意力机制
蒸馏
原型
判别特征
适配器
残差信息
偏差
融合方法
语义特征
系统为您推荐了相关专利信息
数据查询方法
网格
多模态
文档型数据库
自然语言模型
风险报告生成方法
客户
计算机执行指令
自然语言模型
映射关系表
模型构建方法
多视角
跨模态
视觉位置识别方法
局部视觉特征
配电网规划
报告生成方法
自然语言理解模型
数据库表结构
报告生成装置
局部视觉特征
融合特征
语义
样本
多头注意力机制