一种基于人类嘴部运动的语言识别方法以及装置

正文

推荐专利

申请号：CN202411971622

申请日期：2024-12-30

公开号：CN119964572B

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于人类嘴部运动的语言识别方法以及装置，属于语言识别领域，通过采集用户嘴部运动过程中的面部和颈部的肌肉活动的电信号以及嘴部运动过程中面部图像；对肌电信号以及面部图像进行特征提取，将肌电信号特征与面部运动特征进行多模态融合，构建联合特征向量，捕捉静默语音的肌肉活动与口部动作之间的内在关联；基于Transformer网络构建多模态静默语音识别模型，识别对应的语音内容；基于NLP的模糊语言处理，生成完整的句子输出，通过上述步骤，本发明基于人类嘴部运动的语言识别方法能够识别静默方式表达的语音，避免环境干扰，有利于发音障碍人群使用，有利于通信的保密性。

技术关键词

语言识别方法面部关键点检测图像特征提取语音识别模型语言识别装置统计语言模型人类编辑距离算法电信号深度学习模型依存句法分析错误检测运动特征纠正算法图像采集装置表面电极阵列多模态

系统为您推荐了相关专利信息

一种船舶过桥航迹预测方法

船舶航迹预测方法序列过桥图像像素

一种基于光谱角距离和MRPE算法的高光谱图像特征提取方法

图像特征提取方法高光谱图像特征提取加权均值滤波计算机算法

一种基于卷积神经网络的疲劳驾驶检测系统及方法

疲劳驾驶检测系统图像数据预处理疲劳状态检测数据采集模块特征提取模块

基于场景结构信息引导的视觉目标检测方法及系统

场景结构结构特征提取特征金字塔视觉注意力

一种跨模态人机交互意图识别与响应方法

意图识别模型跨模态卷积神经网络提取图像特征眼动轨迹设备控制指令

一种基于人类嘴部运动的语言识别方法以及装置

站点导航

APP 下载