摘要
本发明公开了一种面向自然语音的帕金森病(Parkinson’s Disease,PD)识别系统,包括数据采集器、特征提取模块、分类器模块和输出模块,其中,数据采集器基于自然对话形式采集受试者的语音数据,其涵盖了多个与PD相关的语音特征,如音高、语速、发音流畅性等,用于疾病预测任务。特征提取模块提出基于QR分解的快速正交线性判别分析(QR‑FOLDA)方法,旨在提取与PD相关的高表征特征,增强特征区分能力,提升模型泛化能力和特征判别效果,为后续分析和训练提供有效信息。分类器模块由训练数据训练所得,并用于测试数据的分类,确定其标签类型。输出模块则输出分类器对PD语音数据的标签预测结果,提供最终诊断信息。本发明提出的QR‑FOLDA算法,借助QR矩阵分解有效提升了传统正交LDA算法的求解效率,同时所提取的特征较非正交投影方法更具鉴别力,从而显著提高了后续分类器对PD连续语音的识别精度。此外,该算法能够有效处理不同语种的PD语音数据,为其他语种的PD语音识别提供了有力支持。
技术关键词
自然语音
识别系统
特征提取模块
数据采集器
矩阵
输出模块
训练分类器模型
语音信号特征
声音采集设备
梅尔倒谱系数
语音特征提取
LDA算法
广义特征值
样本
极限学习机