一种融合呼吸气流数据的多模态唇语识别方法和装置

正文

推荐专利

申请号：CN202510107622

申请日期：2025-01-23

公开号：CN120217274A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种融合呼吸气流数据的多模态唇语识别方法和装置，方法包括：获取发音动作视频信号和呼吸气流信号；对发音动作视频信号进行第一预处理，得到发音动作视频；对呼吸气流信号进第二预处理，得到呼吸气流数据；对发音动作视频进行视觉特征提取处理，得到唇动特征；对呼吸气流数据进行成分分析处理，得到频率成分和强度成分；根据频率成分和强度成分，对呼吸气流数据进行气流特征提取处理，得到气流特征；对唇动特征和气流特征进行多模态融合处理，得到融合特征；将融合特征输入到唇语识别模型，得到唇语识别结果。本发明实现了多模态唇语识别，提高了准确率和适用性。本发明可广泛应用于人工智能视觉语音识别技术领域。

技术关键词

唇动特征气流视觉特征提取唇语识别方法融合特征图像特征编码无喉患者发音视频数据深度学习模型频率成分分析强度多模态特征提取模块背景噪声消除高斯背景模型人工智能视觉

系统为您推荐了相关专利信息

一种基于多模态任务驱动增强的水下显著物体检测方法

物体检测方法媒介多模态四叉树算法背景光

颌骨关键点识别及关键点识别模型的训练方法、口腔机器人系统

关键点识别识别方法特征融合网络特征提取网络融合特征

一种小麦早期条锈病检测方法和系统

多模态图像数据特征提取器多尺度融合特征小麦条锈病

基于深度学习的细胞检测图谱生成方法、电子设备及程序产品

异构网络模型融合特征分支单元注意力图谱生成方法

一种基于状态模型的光场图像超分辨率重建方法和装置

深层特征提取状态空间模型浅层特征提取结构特征提取图像重建

一种融合呼吸气流数据的多模态唇语识别方法和装置

站点导航

APP 下载