摘要
本公开实施例涉及一种视频检索模型的训练方法、视频检索方法和装置,该方法包括:获取视频样本和检索文本样本,获取视频样本对应的视觉特征、字幕文本特征和音频特征,配置视觉特征、文本特征和音频特征对应的初始权重参数,基于初始权重参数将视觉特征、字幕文本特征和音频特征进行特征融合得到视频特征,在视频特征和检索文本样本对应的检索文本特征之间的损失值大于等于预设阈值时调整待训练视频检索模型的模型参数和初始权重参数,直到调整后的损失值小于预设阈值得到视频检索模型。本公开实施例训练得到视频检索模型能够精确分配视觉特征、字幕文本特征和音频特征对应的权重参数,从而基于视频检索模型的视频检索的检索结果更准确、全面。
技术关键词
视频检索方法
样本
字幕
参数
图像特征提取模型
视频检索装置
视频帧
音频特征提取
视觉特征提取
光学字符识别
存储装置
转换文本
模块
系统为您推荐了相关专利信息
文本生成方法
样本
关键词
建立文本分类模型
输入模块
探测分析方法
底座一体式结构
加权最小二乘法
激振源
边缘检测算法
深度学习融合
特征值
协方差矩阵
电子
线性回归算法
土壤改良剂
迁移学习算法
协方差矩阵
动态缺陷
传感器阵列