摘要
本发明公开了一种基于自适应视觉残差聚合网络的提示学习方法,属于深度学习技术领域。本发明通过在CLIP模型中引入视觉残差聚合模块以及语义一致性模块根据大模型实际应用场景存在的问题对新类进行分类检测,首先,使用残差聚合模块可实现自适应融合类无关特征,从而有效保留泛化知识。然后,通过语义一致性模块引入一个可学习的线性层,并将残差聚合模块获得的自适应特征输入到语义一致性模块中,加入语义一致性损失和真实标签对泛化性文本提示进行训练。最后通过对比学习,得到最终的分类结果。本发明提出的方法在进行分类任务时,特别是对新类检测,能够有效利用模型遗忘的泛化特征和语义特征对文本提示进行训练,实现了模型的泛化能力和语义识别能力之间的动态平衡,使模型更适配下游任务,有效提高模型在新型上的准确率。
技术关键词
图像块
学习方法
文本编码器
语义特征
模块
视觉
深度学习技术
标签
线性
残差网络
信息编码
数据
图片
融合特征
样本
多模态
系统为您推荐了相关专利信息
计数方法
语言编码器
模板特征
语义
交叉注意力机制
加密策略
信息管理方法
密钥生成器
训练集
信息管理系统
电力智能监控系统
监控中心服务器
电力设备运行环境
Lyapunov指数
电力设备故障
视网膜色素变性
网络构建方法
输出特征
特征提取模块
眼底彩照