摘要
本发明提供了基于Mamba架构的实时在线动作检测技术,包括:S1,训练数据获取,获取目标场景中多个视角的视频流;S2,数据预处理,基于预训练的二维卷积神经网络,从视频流中提取视频特征;S3,引入MambaOAD框架,该框架由动作检测模块和未来预测模块构成;S4,构建动作检测模块,通过线性投影层映射到特征空间,线性投影层通过可学习的权重矩阵,将输入特征转换到D维;S5,构建未来预测模块,基于动作检测模块输出的短期潜在特征,对未来潜在特征进行预测。S6,模型训练与推理,在训练过程中,对相关模块进行联合优化。使用mAP与mcAP指标衡量在线动作检测精度,使用FPS与GFLOPs指标衡量模型推断的复杂度。本发明提高了动作检测的准确性和鲁棒性。
技术关键词
在线动作检测
二维卷积神经网络
状态空间模型
分类器
模块
线性
实时视频流
门控结构
序列
机制
框架
视角
指标
复杂度
阶段
数据
关系
矩阵
系统为您推荐了相关专利信息
饲料配方
关键字
动物种类
家畜饲养技术
动物营养素
排放预测方法
数字孪生模型
碳排放核算方法
LSTM算法
信息同步系统
酒驾识别
音频
语音识别模块
文本识别方法
多模态
信号欠采样
重构方法
叶尖间隙传感器
信号压缩感知
传感器安装位置