声纹识别模型的训练方法、装置、设备以及介质

AITNT
正文
推荐专利
声纹识别模型的训练方法、装置、设备以及介质
申请号:CN202411749967
申请日期:2024-11-28
公开号:CN119626228B
公开日期:2025-09-30
类型:发明专利
摘要
本发明实施例提供一种声纹识别模型的训练方法、装置、设备以及介质,属于声纹识别技术领域。该方法包括利用模型的特征提取层对初始音频数据进行特征提取获得初始声音特征;利用模型的声纹嵌入层对初始声音特征进行表征提取获得初始声音表征信息;利用模型的口音识别层根据初始声音表征信息进行口音识别获得第一分类结果;利用模型的口音损失层根据第一分类结果和口音标签进行损失计算获得第一损失值;利用模型的身份识别层根据初始声音表征信息进行说话人识别获得第二分类结果;利用模型的声纹损失层根据第二分类结果和说话人标签进行损失计算获得第二损失值;根据第一损失值和第二损失值对声纹识别模型进行模型训练获得目标识别模型。
技术关键词
声纹识别模型 语音识别模型 网络结构 说话人识别 声音特征提取 声学特征 数据 模型更新 音频 标签 计算机存储介质 距离信息 文本 声纹识别技术 训练装置 身份识别模块 参数 模型训练模块
系统为您推荐了相关专利信息
1
基于并行处理混合专家网络的多任务语音情感识别方法
混合专家网络 语音情感识别方法 说话人识别 多任务 语音情感识别系统
2
一种清洁车自动避障方法和系统
自动避障方法 智能清洁车 策略 障碍物 自动避障系统
3
一种基于全景立体视觉的管道三维重建与智能检测方法
全景立体视觉 智能检测方法 全景相机 三维点云数据 雷达传感器
4
一种基于群体智能的异常检测方法及系统
异常检测方法 记忆 信息传递模块 特征提取模块 多头注意力机制
5
基于ASR和NLP技术的采购用智能语音系统
智能语音系统 信息提取模型 语音识别模型 联合损失函数 数据存储
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号