摘要
本申请涉及声纹识别、金融科技和智慧医疗技术领域,公开了一种声纹模型增强训练方法及装置、存储介质、计算机设备。先获取干净语音样本及其实际声纹信息并添加噪声得到含噪样本,再利用预训练声纹模型提取两类样本语音特征并转换含噪语音特征为帧级别特征、识别声纹信息,接着将帧级别特征输入语音重建模型确定重建语音特征,计算干净语音特征与重建语音特征的重构性损失以及声纹识别信息与实际声纹信息的判别性损失,最后依据两者优化预训练声纹模型。本申请有助于使得声纹模型在复杂环境下能够精准聚焦干净语音信息,有效抑制环境噪音、信道特性等干扰因素,提升了声纹识别的准确性与鲁棒性,增强了声纹识别系统在实际应用场景中的性能表现。
技术关键词
声纹模型
语音特征提取
样本
重构
语句
计算机设备
声纹识别系统
智慧医疗技术
参数
识别声纹
噪声
处理器
训练装置
模块
鲁棒性
金融
信道
科技