一种视频标签识别及模型训练方法、装置、设备和介质

正文

推荐专利

申请号：CN202411098346

申请日期：2024-08-12

公开号：CN118747866B

公开日期：2025-01-07

类型：发明专利

摘要

本申请涉及视频处理技术领域，尤其涉及一种视频标签识别及模型训练方法、装置、设备和介质，用以高效准确地识别中视频、长视频的标签。方法包括：对各视频帧分别进行编码，获得相应的全局特征和局部特征，并基于特征相似度，分别对获得的全局特征集和局部特征集进行压缩，得到预设存储长度的全局特征序列和局部特征序列；对预训练获得的全局查询特征和局部查询特征进行拼接后，采用自注意力机制提取出相应的自注意力特征；采用交叉注意力机制，提取自注意力特征与全局特征序列中每个全局特征之间的第一交叉注意力特征，与局部特征序列中每个局部特征之间的第二交叉注意力特征；基于各第一交叉注意力特征和各第二交叉注意力特征，识别视频标签。

技术关键词

查询特征交叉注意力机制记忆单元序列大语言模型视觉特征文本视频帧样本标签识别装置转换器特征提取模块模型训练方法解码器标签识别方法电子设备

系统为您推荐了相关专利信息

一种零重力与智能交互融合智能座椅的人机交互方法

智能座椅人机交互方法零重力骶骨压力

一种基于输电线路缺陷图像增广的输电线路缺陷检测方法

输电线路缺陷样本图像修复模型掩膜图像嵌入

一种中文医疗实体关系抽取方法及系统

序列特征门控循环单元融合特征文本字词

BACH1抑制剂在治疗妊娠期肝内胆汁淤积症中的应用

肝内胆汁淤积妊娠期分子药物病理性血管

一种基于机器视觉识别的消防安全巡检方法及系统

机器视觉识别运动矢量场巡检方法矢量图多光谱

一种视频标签识别及模型训练方法、装置、设备和介质

站点导航

APP 下载