摘要
本申请公开了一种模型训练方法及装置、非易失性存储介质、电子设备。其中,方法包括:获取视频数据以及用于描述视频数据的文本数据;对文本数据进行特征提取,得到文本特征,对视频数据中的每个图像帧进行特征提取,得到图像特征;在文本特征和图像特征构成的特征空间中查找共现特征;确定文本特征在特征空间中出现的情况下,共现特征在特征空间中出现的目标概率;确定在特征空间中与共现特征之间的相似度大于阈值的上下文特征,根据目标概率以及上下文特征,确定聚合特征;利用聚合特征对神经网络模型进行训练。本申请解决了由于相关文本视频检索技术中无法有效捕捉视频中细粒度信息,造成的限制模型对视频所出现场景的整体理解的技术问题。
技术关键词
神经网络模型
上下文特征
非易失性存储介质
文本
模型训练方法
图像
数据
视频检索技术
模型训练装置
电子设备
计算机程序产品
样本
注意力
模块
处理器
上采样
存储器
数值
系统为您推荐了相关专利信息
股骨头缺血性坏死
风险预测方法
机器学习模型
文本
风险预测模型
在线状态监测
功率场效应管
相关系数算法
KPCA算法
信息数据处理终端