声纹识别模型的训练方法、装置、设备以及介质

正文

推荐专利

申请号：CN202411749967

申请日期：2024-11-28

公开号：CN119626228B

公开日期：2025-09-30

类型：发明专利

摘要

本发明实施例提供一种声纹识别模型的训练方法、装置、设备以及介质，属于声纹识别技术领域。该方法包括利用模型的特征提取层对初始音频数据进行特征提取获得初始声音特征；利用模型的声纹嵌入层对初始声音特征进行表征提取获得初始声音表征信息；利用模型的口音识别层根据初始声音表征信息进行口音识别获得第一分类结果；利用模型的口音损失层根据第一分类结果和口音标签进行损失计算获得第一损失值；利用模型的身份识别层根据初始声音表征信息进行说话人识别获得第二分类结果；利用模型的声纹损失层根据第二分类结果和说话人标签进行损失计算获得第二损失值；根据第一损失值和第二损失值对声纹识别模型进行模型训练获得目标识别模型。

技术关键词

声纹识别模型语音识别模型网络结构说话人识别声音特征提取声学特征数据模型更新音频标签计算机存储介质距离信息文本声纹识别技术训练装置身份识别模块参数模型训练模块

系统为您推荐了相关专利信息

基于并行处理混合专家网络的多任务语音情感识别方法

混合专家网络语音情感识别方法说话人识别多任务语音情感识别系统

一种清洁车自动避障方法和系统

自动避障方法智能清洁车策略障碍物自动避障系统

一种基于全景立体视觉的管道三维重建与智能检测方法

全景立体视觉智能检测方法全景相机三维点云数据雷达传感器

一种基于群体智能的异常检测方法及系统

异常检测方法记忆信息传递模块特征提取模块多头注意力机制

基于ASR和NLP技术的采购用智能语音系统

智能语音系统信息提取模型语音识别模型联合损失函数数据存储

声纹识别模型的训练方法、装置、设备以及介质

站点导航

APP 下载