一种文本视频的跨模态检索方法

正文

推荐专利

一种文本视频的跨模态检索方法

申请号：CN202510683304

申请日期：2025-05-26

公开号：CN120492671A

公开日期：2025-08-15

类型：发明专利

摘要

本发明涉及信息检索领域，公开了一种文本视频的跨模态检索方法。在训练阶段，其按批次输入候选对，首先分别计算各候选对的相似度；然后，以各候选对的相似度，作为分类概率，基于狄利克雷分布，对分类概率的不确定性进行建模；以样本对所对应候选对分类概率的概率为100％，其他候选对概率为0％，构建标签，完成对模型的训练。在检索阶段，其同样按批次输入候选对，在获得相似度的同时对齐不确定性建模，利用不确定性对相似度进行修正，并以修正后的相似度进行匹配。因此，本发明的方法，能够量化文本视频对中的不确定性，以进行更可靠的相似性评估，有效提升检索性能，解决了现有技术中存在的仅依赖相似性，所导致的可靠性问题。

技术关键词

模态检索方法视觉特征视频图像序列文本编码器样本局部特征提取索引标签超参数线性矩阵交叉注意力机制更新模型参数阶段信息检索

系统为您推荐了相关专利信息

一种基于增强语义研判的交通案例摘要抽取方法

摘要抽取方法字符交通文章随机梯度下降

一种变压器油中溶解气体浓度的预测方法及相关装置

LSTM模型 ARIMA模型变压器滑动窗口序列特征

无线局域网终端时域唤醒方法、系统、设备及存储介质

无线终端无线局域网终端正交频分复用 OFDM时域信号接入点

一种用于辅助乳腺外科穿刺定位的装置

乳腺定位模块标记坐标穿刺模块

一种人体跌倒预测方法、装置、电子设备及存储介质

跌倒预测方法骨骼关键点特征提取模型注意力人体骨骼

一种文本视频的跨模态检索方法

站点导航

APP 下载