一种基于双特征跨尺度融合与通道-空间注意力机制的声纹识别方法和系统

正文

推荐专利

申请号：CN202510868585

申请日期：2025-06-26

公开号：CN120564727A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及一种基于双特征跨尺度融合与通道‑空间注意力机制的声纹识别方法和系统，包括通过训练好的声纹识别模型分别提取注册语音信号和待验证语音信号的说话人嵌入向量，并计算两者说话人嵌入向量的余弦相似度，判定注册语音信号和待验证语音信号是否为同一说话人；数据预处理模块用于对语音信号进行预处理；PLP特征提取模型用于对预处理后的语音信号进行PLP特征的提取，Fbank特征提取模型用于对预处理后的语音信号进行Fbank特征的提取，并将提取的Fbank特征与PLP特征进行拼接融合得到语音信号的融合特征；特征增强模块用于对语音信号的融合特征进行特征增强得到语音信号的说话人嵌入向量。本发明能够提升声纹识别在复杂场景下的鲁棒性，增强识别精度。

技术关键词

声纹识别方法声纹识别模型注意力机制特征提取模型远程监控程序融合特征模块通道计算机存储介质生成语音信号声纹识别系统滤波器网络架构输出特征处理器存储器鲁棒性

一种基于双特征跨尺度融合与通道-空间注意力机制的声纹识别方法和系统

站点导航

APP 下载