摘要
本发明公开了一种基于上下文感知卷积与子网络正则化的连续手语识别方法,采用训练好的识别网络模型对手语视频进行识别,将待识别的手语视频输入至视觉特征提取器,对其在各阶段提取的特征依次通过动态上下文感知卷积模块进行处理,并与原始特征进行残差连接,得到当前阶段的最终特征并传递至下一阶段;将视觉特征提取器的最终输出输入至时间特征提取器,进一步建模时序依赖关系,并通过分类器得到识别结果。本发明通过引入动态上下文感知卷积机制与子网络正则化方法,显著增强了模型对时空动态特征的建模能力,并有效缓解了CTC“尖峰”现象所引发的过拟合问题。
技术关键词
连续手语识别方法
视觉特征提取
特征提取模块
特征提取器
卷积模块
注意力
动态上下文
分类器
全局平均池化
一维卷积神经网络
双向长短期记忆
时序依赖关系
滑动窗口机制
采样模块
输出特征
阶段
正则化方法
系统为您推荐了相关专利信息
图像识别方法
支持向量机分类器
图像采集设备
池化方法
多项式核函数
情感识别方法
交叉注意力机制
Sigmoid函数
短时傅里叶变换
音频特征