摘要
本申请公开了一种跨模态检索模型建模方法、装置、终端及介质,涉及跨模态检索技术领域,本申请提供的方案首先基于不同模态的样本数据,按照不同的模态类型对样本数据进行特征解耦,再基于解耦后的特征计算温度参数以及构建跨模态对比学习模型架构,再通过跨模态对比学习模型的迭代训练,得到跨模态检索模型。本方案通过将不同模态数据的整体特征分解为具有明确语义指向且维度统一的多粒度特征,保留了模态数据内部丰富的语义信息,能够为后续的跨模态对比学习提供了更具区分度和针对性的特征表示,有助于提升跨模态检索模型对复杂语义关系的理解和匹配能力,从而提高跨模态检索的整体性能。
技术关键词
模型建模方法
样本
视频图像特征
语义角色标注
分层
对象
参数
跨模态检索技术
场景
实体
音频特征
注意力机制
传播算法
存储程序代码
数据获取单元
可读存储介质
建模装置
系统为您推荐了相关专利信息
评论生成模型训练方法
文本
语义情感分析
语义分析模型
评论信息生成方法
拓扑映射方法
三维仿真模型
功能块
分层
实时数据
自然语言
查询生成方法
结构化查询语言
查询模型
关键词
液化气设备
设备识别
图像处理方法
识别置信度
计算机可读指令
特征提取模块
贝叶斯神经网络
飞行器
特征值
非瞬时性计算机可读存储介质