摘要
本发明公开了一种基于Banzhaf联盟评估蒸馏的域增量图文检索方法,该方法通过Banzhaf联盟评估将图文检索建模为一个多元合作博弈过程,通过计算图像token和文本token的联盟对检索精度的贡献,以实现更高效的跨模态对比,提高模型准确性。利用对比学习蒸馏和Banzhaf联盟评估蒸馏,保留结构化语义信息,从样本和token级相似度分别约束跨任务结构知识,减轻灾难性遗忘。本发明还提出通过添加token级别的动态语义提示,自适应的补偿模态间的语义信息差异,通过保留域独立的语义提示来保留任务的知识。本方法的提出,主要解决的技术问题包括不同模态特征的结构化语义信息缺失和跨模态知识迁移时的任务间知识偏差。
技术关键词
图文检索方法
文本编码器
蒸馏
图像嵌入
语义
注意力
嵌入特征
合作博弈论
动态
玩家
矩阵
预训练网络
BERT模型
图像编码器
多层感知机
模块
系统为您推荐了相关专利信息
智能导盲方法
智能导盲装置
单目深度估计
耳机
障碍物
可见光图像
图像融合方法
图像融合算法
语义特征提取
融合策略
废水处理装置
摩擦部件
清洁机器人
杆状主体
清洁系统