声纹模型增强训练方法及装置、存储介质、计算机设备

正文

推荐专利

申请号：CN202510921296

申请日期：2025-07-03

公开号：CN120783768A

公开日期：2025-10-14

类型：发明专利

摘要

本申请涉及声纹识别、金融科技和智慧医疗技术领域，公开了一种声纹模型增强训练方法及装置、存储介质、计算机设备。先获取干净语音样本及其实际声纹信息并添加噪声得到含噪样本，再利用预训练声纹模型提取两类样本语音特征并转换含噪语音特征为帧级别特征、识别声纹信息，接着将帧级别特征输入语音重建模型确定重建语音特征，计算干净语音特征与重建语音特征的重构性损失以及声纹识别信息与实际声纹信息的判别性损失，最后依据两者优化预训练声纹模型。本申请有助于使得声纹模型在复杂环境下能够精准聚焦干净语音信息，有效抑制环境噪音、信道特性等干扰因素，提升了声纹识别的准确性与鲁棒性，增强了声纹识别系统在实际应用场景中的性能表现。

技术关键词

声纹模型语音特征提取样本重构语句计算机设备声纹识别系统智慧医疗技术参数识别声纹噪声处理器训练装置模块鲁棒性金融信道科技

声纹模型增强训练方法及装置、存储介质、计算机设备

站点导航

APP 下载