一种基于多模态深度学习的手语识别方法及设备

正文

推荐专利

申请号：CN202510773255

申请日期：2025-06-11

公开号：CN120689932A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于多模态深度学习的手语识别方法及设备，包括：多模态数据输入：通过摄像头、动作捕捉传感器等设备同时捕捉手部动作、手势轨迹和面部表情，构成多模态数据输入；手语动作识别：通过深度卷积神经网络与长短期记忆网络的组合模型，实现对手语动作的精确识别；面部表情与手势轨迹结合识别：通过将捕捉的面部表情与手势轨迹相结合，实现对复杂手语句子的理解与翻译；上下文自然语言处理：结合上下文语义理解，生成目标语句，输出翻译结果。本发明通过手部动作捕捉、面部表情分析、手势轨迹跟踪及上下文自然语言处理，能够更精确地识别复杂的手语动作并实时翻译为文字或语音，做到了低延迟、高准确率。

技术关键词

多模态深度学习手语识别方法上下文语义理解深度卷积神经网络动作捕捉传感器长短期记忆网络手势空间特征提取轨迹数据采集装置手语识别装置自然语言手部动作捕捉面部表情分析残差模块

系统为您推荐了相关专利信息

机器人的移动操作方法、装置、电子设备、存储介质和计算机程序产品

移动操作方法语义地图大语言模型物体深度图

一种色谱信号峰偏移对齐方法、装置和设备

对齐方法信号色谱对齐模块深度卷积神经网络

基于小波变换与深度卷积神经网络的地震损伤评估方法

损伤评估方法深度卷积神经网络生成多尺度加速度地震工程技术

一种基于人工智能的照片地类识别方法

深度卷积神经网络模型照片识别方法人工智能识别技术训练集

基于多级匹配与深度特征的多目标配准方法、设备及介质

配准方法轨迹深度外观度指示器矩阵

一种基于多模态深度学习的手语识别方法及设备

站点导航

APP 下载