视频内容智能识别分类的方法、装置及应用

正文

推荐专利

视频内容智能识别分类的方法、装置及应用

申请号：CN202510616149

申请日期：2025-05-14

公开号：CN120451876A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种视频内容智能识别分类的方法、装置及应用，所述方法基于预训练的Transformer模型对视频内容进行识别分类，包括以下步骤：将输入视频分割为帧，并将每帧图像划分为多个非重叠的图像块；对每个图像块进行特征提取并生成对应的令牌；为每个令牌添加位置编码，表示其在原始图像中的空间位置；将带有位置编码的令牌输入至改进的Transformer编码器中，通过改进的带控单向注意力机制计算令牌间的时空依赖关系，得到视频的时空特征；将Transformer编码器输出的时空特征序列输入全连接层，经全连接层输出视频内容的分类概率分布。本发明通过引入Transformer模型及改进后的带控单向注意力机制，能够在大幅降低计算复杂度的前提下提高视频内容识别分类的精度。

技术关键词

令牌图像块注意力机制控制照明灯运动场地编码器灯光控制信号空间特征提取开启照明灯全局平均池化视频流特征提取模块残差网络传播算法编码模块输出模块

系统为您推荐了相关专利信息

遥感图像的预测方法、装置、终端设备及存储介质

多头注意力机制 sigmoid函数记忆卷积神经网络模型终端设备

一种面向目标检测的自适应特征融合预标注方法

标注方法云端数据中心三维图像数据无人机遥感注意力机制

基于深度学习的多能互补配电系统数据分析方法与系统

数据分析方法故障传播路径设备拓扑结构配电系统异构传感器

一种基于大模型的藻类多维度特征智能识别系统及方法

智能识别系统智能识别方法数据采集模块显微镜成像系统特征提取模块

模型训练方法、烟火检测方法、装置、设备、介质及产品

烟火检测方法训练集模型训练方法烟火检测装置奇异值分解算法

视频内容智能识别分类的方法、装置及应用

站点导航

APP 下载