摘要
提供一种视频标签识别模型训练方法、视频标签识别方法及装置,属于人工智能技术领域,包括:获取第一训练样本集,每个训练样本包括样本视频、样本视频在时刻t的标签和样本视频的文本描述信息,针对每一训练样本,确定训练样本的样本视频的视觉特征,样本视频的视觉特征根据样本视频从时刻t0至时刻t的视频的视觉特征对K个类中心特征进行聚类更新得到,K个类中心特征为对样本视频在时刻t0之前的视频的视觉特征进行聚类得到,根据样本视频的视觉特征、样本视频的文本描述信息、样本视频的第一预测标签以及第一预设范式指令,对视频标签识别模型进行训练,视频标签识别模型包括视觉特征编码器、存储队列、预先训练的对齐模块和识别模型。
技术关键词
视觉特征
对齐模块
识别模型训练方法
标签识别方法
图像块特征
编码器
训练样本集
文本
队列
视频帧
指令
参数
聚类算法
标签识别装置
系统为您推荐了相关专利信息
语义特征提取
跨模态
样本
门控神经网络
遥感图像数据
预警决策方法
多光谱传感器
隐马尔可夫模型
动态时间规整算法
阶段