摘要
本发明提供了一种基于深度语音嵌入的声纹识别方法及系统,包括:获取语音数据,并基于语音数据得到缓冲波形数据;基于缓冲波形数据和预设采样率进行重采样,获取采样语音数据;基于采样语音数据和预设窗口时间进行段落分割,得到分割语音数据;基于分割语音数据进行数据增强处理,获取增强语音数据;基于预训练模型对增强语音数据进行特征提取,获取高维特征向量;基于高维特征向量计算帧级统计信息,并基于注意力机制和帧级统计信息得到段落特征向量;基于段落特征向量进行特征向量匹配,从而进行身份映射,实现声纹识别。本发明提出的一种基于深度语音嵌入的声纹识别方法及系统,保证了声纹识别的准确性,大大提高了声纹识别的效率和可靠性。
技术关键词
声纹识别方法
高维特征向量
深度学习网络模型
预训练模型
大规模语音数据
噪声频谱
采样率
注意力机制
波形
声纹识别系统
身份
缓冲方法
深度神经网络
特征提取模块
滤波
估计算法
系统为您推荐了相关专利信息
信息智能识别方法
关键点识别
体型
预训练模型
无人机
自动计费方法
计费规则
计费策略
训练机器学习模型
计费引擎
多模态数据处理方法
海洋环境数据
深度学习算法
高维特征向量
多源数据采集系统