一种通信场景下基于通道注意力的说话人识别方法

正文

推荐专利

申请号：CN202510625594

申请日期：2025-05-15

公开号：CN120220694B

公开日期：2025-07-29

类型：发明专利

摘要

本申请涉及一种通信场景下基于通道注意力的说话人识别方法。所述方法包括：构建说话人识别模型，该模型包括依次连接的表征提取主干网络与说话人分类网络；将基于跨网络层特征聚合的通道注意力机制，以多个通道注意力网络模块的形式嵌入到表征提取主干网络中，该通道注意力网络模块包括可学习字典编码单元和信息聚合单元；对嵌入有通道注意力网络模块的说话人识别模型进行优化训练，并采用训练好的说话人识别模型执行通信场景下的说话人识别任务。本方法能够通过多层次地表示隐层特征信息，精准感知网络中各通道特征重要性，从而更加高效地进行特征选择和差异化建模，对于提升说话人表征的区分性与说话人识别的准确度具有重要价值。

技术关键词

说话人识别模型声学特征学习字典说话人识别方法编码向量网络模块分类网络通道注意力机制校准残差网络深度学习框架工具包矩阵场景

一种通信场景下基于通道注意力的说话人识别方法

站点导航

APP 下载