摘要
本发明涉及人工智能技术领域,公开了一种视频搜索方法、装置、设备及介质,包括:基于第一文本特征向量和多个第一视频特征向量,确定每个候选视频与视频搜索文本之间的第一相似度,选取排序在前的预设个数的候选视频,作为与视频搜索文本匹配的多个目标视频;基于多个目标视频和第一文本特征向量,生成每个目标视频在空间维度上的第二视频特征向量和在时间维度上的第三视频特征向量;基于第一文本特征向量、第二视频特征向量和第三视频特征向量,确定每个目标视频与视频搜索文本之间的目标相似度,将多个目标视频按照目标相似度从大到小的顺序进行排序。采用先召回再排序的视频搜索方式,在确保视频搜索的准确性的同时,有效提高视频搜索效率。
技术关键词
视频特征向量
文本特征向量
视频搜索方法
图像编码器
图像特征向量
文本编码器
交叉注意力机制
视频帧
图像块
视频搜索装置
样本
多模态
序列
图文
可读存储介质
数据
系统为您推荐了相关专利信息
信息提取方法
实体
演进型
跨模态
多头注意力机制
优先级调度算法
模糊聚类算法
管理系统
图像特征向量
参数
电力营销业务
关键要素提取方法
实体关系抽取模型
BiLSTM模型
构建深度神经网络
风控模型
图像特征向量
性能指标数据
风控方法
样本