视频检索方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411543277

申请日期：2024-10-30

公开号：CN119474459A

公开日期：2025-02-18

类型：发明专利

摘要

本发明涉及多媒体信息处理、自然语言处理及机器学习技术领域，公开了上述视频检索方法、装置、计算机设备及存储介质，通过将检索文本输入到视频检索模型的文本编码器，得到检索文本的文本特征表征；将视频数据输入到视频检索模型的视频编码器，得到每个视频数据的多模态特征表征；然后，分别计算文本特征表征与每个多模态特征表征的特征相似度，选择特征相似度最大的视频数据作为检索到的目标视频数据。可见，本发明通过视频编码器提取视频数据的多模态特征表征来对视频数据进行检索，相较于通过视频数据中的单一图像特征来对视频数据进行检索，可以达到提高视频检索精度的目的。

技术关键词

视频检索方法视频编码器文本编码器多模态特征样本上下文特征视频检索装置计算机设备特征提取模型机器学习技术图像可读存储介质视频帧动作特征数据获取模块

系统为您推荐了相关专利信息

基于轨迹的免训练图像生成方法、电子设备和存储介质

图像生成方法轨迹标签代表分词

基于声纹识别的内容推荐方法、装置、设备及介质

声纹特征内容推荐模型训练特征提取模型内容推荐方法音频

岩土体破裂的前置预警方法及系统

岩土体关键监测参数预警方法样本声发射

内容推理方法、装置、电子设备、存储介质和程序产品

推理方法序列信息单元集合样本信息处理单元

基于机器视觉的语音输入等待控制方法、系统及存储介质

乘员语音输入信息时序面部数据

视频检索方法、装置、计算机设备及存储介质

站点导航

APP 下载