一种基于改进Transformer模型的实时手语识别系统

正文

推荐专利

申请号：CN202510143286

申请日期：2025-02-10

公开号：CN119580360A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了一种基于改进Transformer模型的实时手语识别系统，包括数据预处理模块、特征提取模块和手语翻译模块；数据预处理模块通过帧间差分法实时提取手语视频关键帧，并用YOLOv5算法进行人物识别和图像分割；特征提取模块利用Mediapipe模型检测并提取手部骨骼与嘴型特征，随后进行数据增强和归一化处理，得到特征集；手语翻译模块则通过知识蒸馏改进Transformer模型，将其作为教师模型，同时预训练CNN和RNN作为学生模型，接收特征集进行翻译；本系统能够有效的减少了复杂背景和光照条件的干扰，显著提升了手语识别在实际应用中的鲁棒性。

技术关键词

手语识别系统特征提取模块关键帧多帧差分教师图像分割系数方法学生视频输入系统数据人物手部门控循环单元表达式坐标蒸馏方法中间层

系统为您推荐了相关专利信息

基于切面各向异性CASVim和不确定性门控UCG的脑肿瘤分割算法

不确定性特征脑肿瘤分割特征提取模块冠状医学图像分析技术

一种基于红外双波段图像的端到端抗干扰识别方法

抗干扰识别方法双波段图像特征提取模块通道全局平均池化

一种用于关节活动度评价的深度学习系统

深度学习系统人体关节点空间特征提取图像采集模块深度学习模型

一种基于多模态柔性分类网络的子宫内膜癌诊断方法

卷积模块子宫内膜癌诊断分类网络混合损失函数增强子

一种基于元学习的域泛化血压估计训练方法

血压估计模型信号特征特征提取模块传感血压估计方法

一种基于改进Transformer模型的实时手语识别系统

站点导航

APP 下载