摘要
本发明公开了一种基于改进Transformer模型的实时手语识别系统,包括数据预处理模块、特征提取模块和手语翻译模块;数据预处理模块通过帧间差分法实时提取手语视频关键帧,并用YOLOv5算法进行人物识别和图像分割;特征提取模块利用Mediapipe模型检测并提取手部骨骼与嘴型特征,随后进行数据增强和归一化处理,得到特征集;手语翻译模块则通过知识蒸馏改进Transformer模型,将其作为教师模型,同时预训练CNN和RNN作为学生模型,接收特征集进行翻译;本系统能够有效的减少了复杂背景和光照条件的干扰,显著提升了手语识别在实际应用中的鲁棒性。
技术关键词
手语识别系统
特征提取模块
关键帧
多帧差分
教师
图像分割
系数方法
学生
视频输入系统
数据
人物手部
门控循环单元
表达式
坐标
蒸馏方法
中间层
系统为您推荐了相关专利信息
不确定性特征
脑肿瘤分割
特征提取模块
冠状
医学图像分析技术
抗干扰识别方法
双波段图像
特征提取模块
通道
全局平均池化
深度学习系统
人体关节点
空间特征提取
图像采集模块
深度学习模型
卷积模块
子宫内膜癌诊断
分类网络
混合损失函数
增强子
血压估计模型
信号特征
特征提取模块
传感
血压估计方法