摘要
本申请涉及一种融合3DCNN与注意力机制的行为识别模型训练方法和系统,相比较于相关技术通过类ViT的深度行为识别方法,本实施例中采用3DCNN和结合注意力机制的Transformer Block进行特征提取,可以在运算复杂度较小、算力消耗较小的前提下,实现精准的人员行为识别。
技术关键词
注意力机制
空间特征提取
识别模型训练方法
全局特征融合
视频帧
图像
网络
全局特征提取
模块
训练集
数据
标签
处理器
复杂度
识别方法
计算机设备
调度器
可读存储介质
存储器
系统为您推荐了相关专利信息
场景分割方法
语义特征提取
多模态
实时视频流
通道校正
水下声源
注意力机制
卷积递归网络
非线性噪声
编码器信息
特征加权融合
时序特征
图像特征提取
注意力机制
采样模块