摘要
本发明提供一种基于深度学习的实时手语识别系统及装置,涉及视频识别技术领域。该基于深度学习的实时手语识别系统及装置,利用摄像头获取实时的手语RGB视频,将视频进行抽帧,把抽帧剩下的图像进行图像预处理,将处理后的数据输入Mediapipe网络进行关键点检测,之后将检测的关键点数据输入Transformer网络进行手语分类。该系统有实时性、识别率高等特点,能够实时检测人体关键点并进行手语识别,手语识别系统可以将手语动作转化为可理解的文字或语音信息,从而帮助聋哑人士与非手语用户进行无障碍的交流,具有广泛的应用前景,可部署在聋哑学校、商场、医院等地方辅助听障人士交流。
技术关键词
手语识别系统
人体关键点
面部关键点
数据
手部关键点检测
辅助听障人士
空间手势识别
人体骨骼关键点
主机模块
视频识别技术
多头注意力机制
前馈神经网络
摄像头模块
神经网络模型
预测类别
编码器
系统为您推荐了相关专利信息
自动测试方法
水表计量
采集硬件系统
图像识别系统
图像传感器
强化学习代理
插件模块
在线测试方法
预训练模型
插件功能
工业缺陷检测
视觉特征
训练图像数据
检测工业
文本编码器
身份验证方法
生物特征信息
语音
时域特征
梅尔频率倒谱系数