一种基于改进Transformer模型的实时手语识别系统

AITNT
正文
推荐专利
一种基于改进Transformer模型的实时手语识别系统
申请号:CN202510143286
申请日期:2025-02-10
公开号:CN119580360A
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了一种基于改进Transformer模型的实时手语识别系统,包括数据预处理模块、特征提取模块和手语翻译模块;数据预处理模块通过帧间差分法实时提取手语视频关键帧,并用YOLOv5算法进行人物识别和图像分割;特征提取模块利用Mediapipe模型检测并提取手部骨骼与嘴型特征,随后进行数据增强和归一化处理,得到特征集;手语翻译模块则通过知识蒸馏改进Transformer模型,将其作为教师模型,同时预训练CNN和RNN作为学生模型,接收特征集进行翻译;本系统能够有效的减少了复杂背景和光照条件的干扰,显著提升了手语识别在实际应用中的鲁棒性。
技术关键词
手语识别系统 特征提取模块 关键帧 多帧差分 教师 图像分割 系数方法 学生 视频输入系统 数据 人物手部 门控循环单元 表达式 坐标 蒸馏方法 中间层
系统为您推荐了相关专利信息
1
基于切面各向异性CASVim和不确定性门控UCG的脑肿瘤分割算法
不确定性特征 脑肿瘤分割 特征提取模块 冠状 医学图像分析技术
2
一种基于红外双波段图像的端到端抗干扰识别方法
抗干扰识别方法 双波段图像 特征提取模块 通道 全局平均池化
3
一种用于关节活动度评价的深度学习系统
深度学习系统 人体关节点 空间特征提取 图像采集模块 深度学习模型
4
一种基于多模态柔性分类网络的子宫内膜癌诊断方法
卷积模块 子宫内膜癌诊断 分类网络 混合损失函数 增强子
5
一种基于元学习的域泛化血压估计训练方法
血压估计模型 信号特征 特征提取模块 传感 血压估计方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号