一种基于文本注意力的跨模态表征模型构建方法及检索方法

AITNT
正文
推荐专利
一种基于文本注意力的跨模态表征模型构建方法及检索方法
申请号:CN202411047051
申请日期:2024-08-01
公开号:CN119128049A
公开日期:2024-12-13
类型:发明专利
摘要
本发明涉及一种基于文本注意力的跨模态表征模型构建方法及检索方法,其在在线模型中增加了两个极具创新性的模块:基于注意力引导的掩码建模模块和文本增强模块。其中,注意力引导的掩码建模模块以文本编码前向过程中的注意力为参考,对文本描述中的单词进行自适应掩盖,这样一来,掩码语言建模模块在预测掩盖词的过程中,能够捕获与掩盖词相关联的语义进行对齐,从而更高效地对齐跨模态表征。文本增强模块以一种轻量化的方式来对下游任务数据集中的文本描述进行了扩充,解决了数据集中文本描述用词单一且存在错误等问题,提高了检索准确率。
技术关键词
注意力 文本编码器 模型构建方法 编码特征 跨模态 图像编码器 在线 标记 模块 实例检索方法 输出特征 编码向量 标志 图片
系统为您推荐了相关专利信息
1
基于低代码的多模态大模型构建方法
数据对齐模块 非结构化数据处理 模型构建方法 数据处理模块 自动化特征工程
2
面向室内安防监控视频场景的开放词汇群体行为检测方法
室内安防监控 文本编码器 注意力模型 多模态 图像编码器
3
一种油田设备自适应控制系统
油田设备 时间序列预测模型 指数 原油 控制系统
4
智能视觉感知的多变量自适应皮带纠偏控制方法和系统
智能视觉感知 状态观测器 状态空间模型 纠偏控制方法 皮带纠偏装置
5
一种电池热模型构建方法、系统及相关设备
模型构建方法 热失控预警 径向基函数神经网络 电池老化特性 电池热管理技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号