摘要
本发明提供了一种基于语音融合特征的跨语种说话人识别方法及系统,涉及语音处理技术领域,该方法通过对原始语音信号进行带通滤波,提取浊音段并整合为新语音段;提取新语音段中的基音周期和MFCC特征,串联形成融合特征向量;输入多个测试者的多语种语音段,提取融合特征,使用K均值聚类和EM算法训练得到每个说话人的GMM模型;输入测试语音段,提取融合特征,计算与GMM模型的似然概率得分,与预设阈值比较,确认或拒绝测试者身份。本发明能够从语音信号中提取更加稳定的特征,从而提高跨语种说话人识别的准确率,有效应对说话人语种失配的情况,提升识别性能,尤其是在双语或多语种的应用场景下,具有较强的适应性。
技术关键词
说话人识别方法
说话人识别系统
多语种语音
融合特征提取
Teager能量算子
周期
K均值聚类方法
EM算法
语音特征
MFCC特征
说话人模型
高斯混合模型
身份
信号
模块
带通滤波器