摘要
本发明提供一种声纹识别方法、装置、电子设备及存储介质,属于语音识别技术领域,所述方法包括:基于训练数据集,对生成对抗网络进行训练;基于生成对抗网络中判别器在验证数据集上的性能,迭代更新生成对抗网络中生成器的生成样本比例,得到最优生成样本比例;基于最优生成样本比例,对声纹识别模型进行训练,得到目标声纹识别模型;将待识别语音输入至目标声纹识别模型,得到目标声纹识别模型输出的声纹识别结果。本发明应用生成对抗网络生成合成语音样本,解决声纹识别中数据集有限和多样性不足的问题;在模型训练过程中逐步调整生成样本的数量,找到生成样本与真实样本的最优比例,确保模型保持高精度,并具有良好的泛化能力。
技术关键词
声纹识别模型
声纹识别方法
生成对抗网络
注意力
样本
梅尔频率倒谱系数
非暂态计算机可读存储介质
声纹识别装置
信号
语音识别技术
离散余弦变换
全局平均池化
数据
电子设备
处理器
权重特征
滤波
计算机程序产品
通道
系统为您推荐了相关专利信息
深度网络模型
土地利用变化检测
多角度
场景
样本
近红外光谱预测模型
近红外无损检测
神经酸
误差反向传播神经网络
变量筛选方法