摘要
本发明公开了一种基于时空通道注意力机制的陆地哺乳动物动作识别方法,属于深度学习动作识别技术领域。本发明首先设置动作识别模型,其包括提取视频的时空特征的3D主干网络、提取视频关键帧的空间特征的2D主干网络,对时空特征和空间特征进行特征融合的通道融合模块,其输出经第一卷积块后输入注意力机制模块,注意力机制模块输出的注意力特征图经第二卷积块送入分类层,分类层用于对分类特征图进行动作识别预测,获取动作识别预测结果,包括:陆地哺乳动物动作类别、预测框的置信度和预测框的位置信息;基于采集的训练数据集对动作识别模型进行深度学习训练,当满足预置的收敛条件时,得到用于目标动物的动作识别模型;动作识别模型进行深度学习训练时采用的总损失函数为预测框回归函数、分类函数和置信度函数的加权和。本发明在现有基于深度学习的时空动作识别模型的基础上,对主干网络架构、损失函数组成等进行优化,一定程度上克服了原模型小样本动作、易混淆动作识别困难等问题,增强了模型泛化能力以及对陆地哺乳动物的识别准确率,提升了检测性能。
技术关键词
动作识别模型
深度学习训练
动作识别方法
通道注意力机制
堆叠模块
融合特征
分类特征
陆地
级联
关键帧
动作识别技术
样本
视频
表达式
网络架构
系统为您推荐了相关专利信息
超声波测距传感器
工况
5G通信模块
图像采集模块
超声波测距器
动作识别模型
关键点
生成学习数据
变换特征
生成动作
趋势预测方法
变分模态分解算法
双向长短期记忆
数据
网格