一种基于语音融合特征的跨语种说话人识别方法及系统

AITNT
正文
推荐专利
一种基于语音融合特征的跨语种说话人识别方法及系统
申请号:CN202510303490
申请日期:2025-03-14
公开号:CN120108401B
公开日期:2025-11-18
类型:发明专利
摘要
本发明提供了一种基于语音融合特征的跨语种说话人识别方法及系统,涉及语音处理技术领域,该方法通过对原始语音信号进行带通滤波,提取浊音段并整合为新语音段;提取新语音段中的基音周期和MFCC特征,串联形成融合特征向量;输入多个测试者的多语种语音段,提取融合特征,使用K均值聚类和EM算法训练得到每个说话人的GMM模型;输入测试语音段,提取融合特征,计算与GMM模型的似然概率得分,与预设阈值比较,确认或拒绝测试者身份。本发明能够从语音信号中提取更加稳定的特征,从而提高跨语种说话人识别的准确率,有效应对说话人语种失配的情况,提升识别性能,尤其是在双语或多语种的应用场景下,具有较强的适应性。
技术关键词
说话人识别方法 说话人识别系统 多语种语音 融合特征提取 Teager能量算子 周期 K均值聚类方法 EM算法 语音特征 MFCC特征 说话人模型 高斯混合模型 身份 信号 模块 带通滤波器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号