基于视觉语义提示协作的泛化零样本学习方法

AITNT
正文
推荐专利
基于视觉语义提示协作的泛化零样本学习方法
申请号:CN202411743524
申请日期:2024-11-30
公开号:CN119580001A
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了基于视觉语义提示协作的泛化零样本学习方法,借助类语义信息识别可见和不可见类别的图像,其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类;包括步骤一:浅层的弱提示融合;步骤二:深层的强提示融合;步骤三:视觉提示发散损失和语义蒸馏损失优化;该方法设计视觉提示来整合内部视觉信息以进行判别特征学习,并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制,通过视觉提示和语义提示的协作,可以获得语义丰富的特征,用于广义零样本图像识别。大量实验表明,该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。
技术关键词
零样本学习方法 局部视觉特征 全局视觉特征 图像视觉特征 自然语言模型 注意力机制 蒸馏 原型 判别特征 适配器 残差信息 偏差 融合方法 语义特征
系统为您推荐了相关专利信息
1
一种多模态数据查询方法、装置、设备及介质
数据查询方法 网格 多模态 文档型数据库 自然语言模型
2
客户风险报告生成方法、装置、电子设备、介质和产品
风险报告生成方法 客户 计算机执行指令 自然语言模型 映射关系表
3
基于多视角跨模态匹配的位置识别模型构建方法及系统
模型构建方法 多视角 跨模态 视觉位置识别方法 局部视觉特征
4
基于交互式大模型Agent的配电网规划报告生成方法及装置
配电网规划 报告生成方法 自然语言理解模型 数据库表结构 报告生成装置
5
一种语义感知和信息对齐的跨域少样本伪装目标检测方法
局部视觉特征 融合特征 语义 样本 多头注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号