一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统

正文

推荐专利

申请号：CN202411114779

申请日期：2024-08-14

公开号：CN119068870B

公开日期：2025-03-25

类型：发明专利

摘要

本发明公开了一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统。本发明通过采集发声时的喉部振动信号解码声调与中文四声，采集发声时的唇部动点数据解码声韵母与音节，两者结果进行多模态融合，并将结果送入到大语言模型中，最终大语言模型输出识别文字。相较于传统的面颈部生理信号语音解码方法，本发明语音识别方法，具有适合长期监测，符合语言学的音节构成原理，受语料库影响小，泛化能力强，与单模态无法实现的单字符级别的识别精度与准确度等特点。

技术关键词

振动信号识别数据识别模型信号预处理模块多模态支持向量机分类信号采集模块频域特征提取识别系统发声语音解码方法大语言模型语音识别方法压电传感器信号放大器

系统为您推荐了相关专利信息

基于三维液体二极管的造口底盘、造口检测系统、算法

二极管监测算法肠鸣音传感器微型热电偶智能检测系统

一种基于毫米波雷达的巷道形变监测装置

形变监测装置动态测量范围雷达故障诊断模块 ARIMA模型

AI大模型和数据编织的多源异构信息融合与分析方法

融合特征分析方法图谱数据网络多模态

一种风力机叶片声纹识别检测方法

风力机叶片支持向量机分类器信号叶片状态监测小波分析方法

数据与知识协同驱动的认知效度计算模型增强方法及系统

高斯核函数互动特征数据矩阵教学

一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统

站点导航

APP 下载