摘要
本发明涉及一种基于双特征跨尺度融合与通道‑空间注意力机制的声纹识别方法和系统,包括通过训练好的声纹识别模型分别提取注册语音信号和待验证语音信号的说话人嵌入向量,并计算两者说话人嵌入向量的余弦相似度,判定注册语音信号和待验证语音信号是否为同一说话人;数据预处理模块用于对语音信号进行预处理;PLP特征提取模型用于对预处理后的语音信号进行PLP特征的提取,Fbank特征提取模型用于对预处理后的语音信号进行Fbank特征的提取,并将提取的Fbank特征与PLP特征进行拼接融合得到语音信号的融合特征;特征增强模块用于对语音信号的融合特征进行特征增强得到语音信号的说话人嵌入向量。本发明能够提升声纹识别在复杂场景下的鲁棒性,增强识别精度。
技术关键词
声纹识别方法
声纹识别模型
注意力机制
特征提取模型
远程监控程序
融合特征
模块
通道
计算机存储介质
生成语音信号
声纹识别系统
滤波器
网络架构
输出特征
处理器
存储器
鲁棒性