摘要
本发明公开了一种基于两种级别的可适应参数生成跨语言跨模态检索方法,该方法分为两个阶段,第一个阶段旨在源语言和目标语言之间的对齐实现跨语言的迁移,第二阶段旨在目标语言和图像之间的对齐,实现跨模态的对齐。在第一阶段中,对文本编码器层参数进行了冻结,并在目标语言分支的每一层的文本编码器层的后面添加了共享适配器模块、句子级别适配器模块和token级别适配器模块,然后分别经过这三个模块之后按照权重相加,得到这一层的输出。本发明使用新颖的自适应参数生成适配器结构,利用两种级别文本信息和共享文本信息进行跨语言跨模态检索。
技术关键词
跨模态检索方法
文本编码器
共享适配器
矩阵
图像编码器
语义
分支
参数
模块
偏差
非线性
适配器结构
文本特征向量
模式
词嵌入向量
阶段
系统为您推荐了相关专利信息
继电保护装置
多级评价指标
权重模型
保护动作时间
SOE分辨率
节点设备
流量管理设备
线性规划模型
发送设备
接收设备