基于曼巴网络对图像基础模型进行适应调节的视频分类方法

正文

推荐专利

申请号：CN202510320695

申请日期：2025-03-18

公开号：CN120388315A

公开日期：2025-07-29

类型：发明专利

摘要

本发明涉及一种基于曼巴网络对图像基础模型进行适应调节的视频分类方法。通过引入曼巴网络的状态空间模型与图像基础模型相结合，实现了对视频数据中时空特征的高效提取与适应性调节，从而提高了视频识别系统的准确性和计算效率。包括以下主要步骤：对输入视频进行预处理编码为长序列的视频特征；使用窗口划分对长序列视频特征进行分组并在组内计算自相关性特征；利用曼巴网络处理长序列视频特征，并通过调制函数进行调节；将调制后的特征送入图像基础模型的后续层进行前向传播；通过分类器进行视频分类。本发明提供了一种新的视频识别框架，能够在不改变基础模型结构的前提下，通过曼巴网络的调节机制，提升视频识别性能。

技术关键词

视频分类方法序列基础输出特征视频分类系统状态空间模型网络分类器视频识别系统位置编码信息注意力机制模型预训练视频帧图像编码模块蒸馏

系统为您推荐了相关专利信息

一种基于三维高斯溅射的三维场景重建的存储优化方法

存储优化方法基元透明度聚类技术场景

一种目标跟踪识别方法、装置和电子设备

人脸特征标识身份跟踪识别方法非易失性计算机可读存储介质

机器人位姿控制方法、系统、设备及介质

控制点机器人位姿控制器工件执行器

一种CAD模型曲面裁剪方法、装置、设备及介质

网格曲面裁剪方法面片线段

基于智能AI的在线调解内容推荐方法及系统

内容推荐方法并行蒙特卡洛策略心理生成规则

基于曼巴网络对图像基础模型进行适应调节的视频分类方法

站点导航

APP 下载