基于视觉语义提示协作的泛化零样本学习方法

AITNT
正文
推荐专利
基于视觉语义提示协作的泛化零样本学习方法
申请号:CN202411743524
申请日期:2024-11-30
公开号:CN119580001A
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了基于视觉语义提示协作的泛化零样本学习方法,借助类语义信息识别可见和不可见类别的图像,其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类;包括步骤一:浅层的弱提示融合;步骤二:深层的强提示融合;步骤三:视觉提示发散损失和语义蒸馏损失优化;该方法设计视觉提示来整合内部视觉信息以进行判别特征学习,并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制,通过视觉提示和语义提示的协作,可以获得语义丰富的特征,用于广义零样本图像识别。大量实验表明,该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。
技术关键词
零样本学习方法 局部视觉特征 全局视觉特征 图像视觉特征 自然语言模型 注意力机制 蒸馏 原型 判别特征 适配器 残差信息 偏差 融合方法 语义特征
系统为您推荐了相关专利信息
1
一种用于RNA序列下游任务的基准模型DRFORMER
图像视觉特征 嵌入特征 基准 序列 多模态特征融合
2
基于大模型的交互式建模方法、装置、设备及存储介质
数据处理模块 交互式建模方法 自然语言模型 预测建模 指令
3
一种利用机器学习预测中间相辅助钙钛矿相纯化的方法和钙钛矿电池
钙钛矿电池 钙钛矿薄膜 钙钛矿前驱体溶液 薄膜太阳能电池技术 钙钛矿太阳能电池
4
基于自然语言模型的铁路知识问答方法和装置
铁路 知识问答方法 自然语言模型 特征向量库 答案
5
文本识别方法、装置、可读介质、电子设备及程序产品
文本识别方法 文本识别模型 视觉特征编码 矫正 多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号