摘要
本发明公开了一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统。本发明通过采集发声时的喉部振动信号解码声调与中文四声,采集发声时的唇部动点数据解码声韵母与音节,两者结果进行多模态融合,并将结果送入到大语言模型中,最终大语言模型输出识别文字。相较于传统的面颈部生理信号语音解码方法,本发明语音识别方法,具有适合长期监测,符合语言学的音节构成原理,受语料库影响小,泛化能力强,与单模态无法实现的单字符级别的识别精度与准确度等特点。
技术关键词
振动信号识别
数据识别模型
信号预处理模块
多模态
支持向量机分类
信号采集模块
频域特征提取
识别系统
发声
语音解码方法
大语言模型
语音识别方法
压电传感器
信号放大器
系统为您推荐了相关专利信息
二极管
监测算法
肠鸣音传感器
微型热电偶
智能检测系统
形变监测装置
动态测量范围
雷达
故障诊断模块
ARIMA模型
风力机叶片
支持向量机分类器
信号
叶片状态监测
小波分析方法