一种基于语音融合特征的跨语种说话人识别方法及系统

正文

推荐专利

申请号：CN202510303490

申请日期：2025-03-14

公开号：CN120108401B

公开日期：2025-11-18

类型：发明专利

摘要

本发明提供了一种基于语音融合特征的跨语种说话人识别方法及系统，涉及语音处理技术领域，该方法通过对原始语音信号进行带通滤波，提取浊音段并整合为新语音段；提取新语音段中的基音周期和MFCC特征，串联形成融合特征向量；输入多个测试者的多语种语音段，提取融合特征，使用K均值聚类和EM算法训练得到每个说话人的GMM模型；输入测试语音段，提取融合特征，计算与GMM模型的似然概率得分，与预设阈值比较，确认或拒绝测试者身份。本发明能够从语音信号中提取更加稳定的特征，从而提高跨语种说话人识别的准确率，有效应对说话人语种失配的情况，提升识别性能，尤其是在双语或多语种的应用场景下，具有较强的适应性。

技术关键词

说话人识别方法说话人识别系统多语种语音融合特征提取 Teager能量算子周期 K均值聚类方法 EM算法语音特征 MFCC特征说话人模型高斯混合模型身份信号模块带通滤波器

一种基于语音融合特征的跨语种说话人识别方法及系统

站点导航

APP 下载