一种基于人类嘴部运动的语言识别方法以及装置

AITNT
正文
推荐专利
一种基于人类嘴部运动的语言识别方法以及装置
申请号:CN202411971622
申请日期:2024-12-30
公开号:CN119964572B
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了一种基于人类嘴部运动的语言识别方法以及装置,属于语言识别领域,通过采集用户嘴部运动过程中的面部和颈部的肌肉活动的电信号以及嘴部运动过程中面部图像;对肌电信号以及面部图像进行特征提取,将肌电信号特征与面部运动特征进行多模态融合,构建联合特征向量,捕捉静默语音的肌肉活动与口部动作之间的内在关联;基于Transformer网络构建多模态静默语音识别模型,识别对应的语音内容;基于NLP的模糊语言处理,生成完整的句子输出,通过上述步骤,本发明基于人类嘴部运动的语言识别方法能够识别静默方式表达的语音,避免环境干扰,有利于发音障碍人群使用,有利于通信的保密性。
技术关键词
语言识别方法 面部关键点检测 图像特征提取 语音识别模型 语言识别装置 统计语言模型 人类 编辑距离算法 电信号 深度学习模型 依存句法分析 错误检测 运动特征 纠正算法 图像采集装置 表面电极阵列 多模态
系统为您推荐了相关专利信息
1
一种船舶过桥航迹预测方法
船舶 航迹预测方法 序列 过桥 图像像素
2
一种基于光谱角距离和MRPE算法的高光谱图像特征提取方法
图像特征提取方法 高光谱图像特征提取 加权均值滤波 计算机 算法
3
一种基于卷积神经网络的疲劳驾驶检测系统及方法
疲劳驾驶检测系统 图像数据预处理 疲劳状态检测 数据采集模块 特征提取模块
4
基于场景结构信息引导的视觉目标检测方法及系统
场景结构 结构特征提取 特征金字塔 视觉 注意力
5
一种跨模态人机交互意图识别与响应方法
意图识别模型 跨模态 卷积神经网络提取图像特征 眼动轨迹 设备控制指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号