摘要
本发明公开了一种基于增强因果建模和特征共识的时序动作检测方法及系统。该方法包括:S1、针对待检测视频,使用预训练的3D卷积模型提取待检测视频中所有片段的视频特征并进行维度嵌入后,组合形成视频特征表示序列;S2、将所述视频特征表示序列输入由多层编码层堆叠形成的编码器中,依次经过每一层编码层提取不同尺度的时序动作特征;S3、将编码器中所有编码层提取的不同尺度的时序动作特征输入由回归头和分类头组成的检测头中,得到每个片段的动作分类以及起止时间。本发明可显著提升复杂场景下动作边界定位精度与背景干扰抑制能力,在四个具有挑战性的基准数据集上的表现超越了多种最先进的方法。
技术关键词
时序动作检测方法
动作特征
输出特征
分支
卷积模型
视频
编码器
计算机电子设备
动作检测系统
非线性
存储计算机程序
抑制算法
计算机程序产品
注意力机制
序列
通道
处理器
系统为您推荐了相关专利信息
多层膜结构
密度泛函理论
发射器
反射率
参数计算方法