摘要
本发明涉及手语智能交流技术领域,具体为聋哑人手语翻译发音系统,包括数据采集与预处理模块、手语模型识别模块、动态手势模型模块、语音转换模块。该聋哑人手语翻译发音系统,通过采用广角摄像头智能眼镜视觉采集,无需穿戴设备,结合视频流与热力图通过视觉信息与关键点概率分布互补,减少单一模态噪声的影响,通过3D CNN提取视频时空特征,结合Transformer的自注意力机制捕捉长程依赖,提升手语识别精度,通过标定板计算内参矩阵和畸变系数,修正广角镜头失真,确保手部关键点定位准确,采用YOLOv8分割干扰物体,避免背景噪声影响识别,并利用MediaPipe生成21个关键点热力图,通过高斯核扩散增强对低置信度关键点的容错性,提高模型识别精度。
技术关键词
聋哑人手语
发音系统
attention机制
手部关键点
广角摄像头组件
视频流
广角镜头模组
坐标
热力图
高斯核函数
图像处理芯片
Attention机制
手语特征
取像设备
文字转语音模块
掩膜
动态手势
数据传输模块
系统为您推荐了相关专利信息
人格评估方法
动态
注意力机制
建立分类模型
面部微表情
洗手
监控识别方法
人体姿态估计算法
深度学习算法
关节
指关节
康复训练方法
康复机器人
肘部托架
回转支撑轴承