摘要
本发明实施例提供一种声纹识别模型的训练方法、装置、设备以及介质,属于声纹识别技术领域。该方法包括利用模型的特征提取层对初始音频数据进行特征提取获得初始声音特征;利用模型的声纹嵌入层对初始声音特征进行表征提取获得初始声音表征信息;利用模型的口音识别层根据初始声音表征信息进行口音识别获得第一分类结果;利用模型的口音损失层根据第一分类结果和口音标签进行损失计算获得第一损失值;利用模型的身份识别层根据初始声音表征信息进行说话人识别获得第二分类结果;利用模型的声纹损失层根据第二分类结果和说话人标签进行损失计算获得第二损失值;根据第一损失值和第二损失值对声纹识别模型进行模型训练获得目标识别模型。
技术关键词
声纹识别模型
语音识别模型
网络结构
说话人识别
声音特征提取
声学特征
数据
模型更新
音频
标签
计算机存储介质
距离信息
文本
声纹识别技术
训练装置
身份识别模块
参数
模型训练模块
系统为您推荐了相关专利信息
混合专家网络
语音情感识别方法
说话人识别
多任务
语音情感识别系统
自动避障方法
智能清洁车
策略
障碍物
自动避障系统
全景立体视觉
智能检测方法
全景相机
三维点云数据
雷达传感器
异常检测方法
记忆
信息传递模块
特征提取模块
多头注意力机制
智能语音系统
信息提取模型
语音识别模型
联合损失函数
数据存储