摘要
本发明涉及深度学习以及视频分析领域,本发明提供了一种基于多维度时空信息激励的视频人体行为识别方法。该方法包括:将处理好的视频帧图像数据输入到基于2D卷积的视频动作分类模型中,通过多维度时空特征增强模块沿不同轴上下文校准基于多尺度卷积结构学习到的时空特征;通过多尺度运动差分注意模块提取不同时空尺度下的运动信息;通过自适应运动信息聚合模块聚合提取到的多尺度运动信息;将最终的模型学习到的时空特征和运动特征表示累加聚合并输入到结构为全连接层的分类器中得到最终的动作分类结果。本发明方法能够帮助模型更有效地学习显著性时空特征并且更好地平衡计算消耗和分类准确率。
技术关键词
运动特征
多尺度
识别方法
卷积结构学习
人体
视频动作分类
分支
通道
分类器
更新模型参数
全局平均池化
注意力
分类准确率
生成动作
动作特征
对齐模块
视频分析
系统为您推荐了相关专利信息
滑坡地质灾害
快速识别方法
无人机航摄技术
滑坡灾害
基线
低空无人机
意图识别模型
航迹数据处理
意图识别方法
无人机集群对抗
智能预报方法
解码器
编码器
注意力机制
时序依赖关系
运动康复方法
类别分析方法
数字孪生体
患者
知识图谱技术