摘要
本发明涉及一种基于文本注意力的跨模态表征模型构建方法及检索方法,其在在线模型中增加了两个极具创新性的模块:基于注意力引导的掩码建模模块和文本增强模块。其中,注意力引导的掩码建模模块以文本编码前向过程中的注意力为参考,对文本描述中的单词进行自适应掩盖,这样一来,掩码语言建模模块在预测掩盖词的过程中,能够捕获与掩盖词相关联的语义进行对齐,从而更高效地对齐跨模态表征。文本增强模块以一种轻量化的方式来对下游任务数据集中的文本描述进行了扩充,解决了数据集中文本描述用词单一且存在错误等问题,提高了检索准确率。
技术关键词
注意力
文本编码器
模型构建方法
编码特征
跨模态
图像编码器
在线
标记
模块
实例检索方法
输出特征
编码向量
标志
图片
系统为您推荐了相关专利信息
数据对齐模块
非结构化数据处理
模型构建方法
数据处理模块
自动化特征工程
室内安防监控
文本编码器
注意力模型
多模态
图像编码器
智能视觉感知
状态观测器
状态空间模型
纠偏控制方法
皮带纠偏装置
模型构建方法
热失控预警
径向基函数神经网络
电池老化特性
电池热管理技术