摘要
本申请涉及机器学习技术领域,公开了一种视频检索方法、装置、计算机设备及存储介质。方法包括:获取视频数据和与视频数据相关的文本数据;利用视频编码器对视频数据进行编码得到视频编码数据,利用第一文本编码器和第二文本编码器对文本数据进行编码得到第一文本编码和第二文本编码;根据第一文本编码、第二文本编码和视频编码数据,利用多模态模型计算得到视频片段相关值数据;获取多个显著向量,根据多个显著向量、视频片段相关值数据和视频编码数据,计算得到显著性标记;将显著性标记与视频数据输入至检索模型,得到目标视频数据。通过在视频片段检索中应用多模态模型技术,以使用户能够检索到与文本语义相符的视频片段,使创作更高效便捷。
技术关键词
视频编码数据
文本编码器
视频检索方法
视频编码器
多模态
编码向量
计算机设备
编码器模块
标记
匈牙利匹配算法
视频检索装置
解码器
数据特征提取
机器学习技术
处理器
系统为您推荐了相关专利信息
显影结构
光学定位结构
追踪系统
手术导航系统
电磁
影像配准方法
梯度下降优化算法
感兴趣
影像分割算法
点云
无人机电力巡检
故障定位方法
巡检数据
地图
平台