摘要
一种基于梯度类激活映射的水下目标噪声源分类模型可解释性方法。第一部分:先对数据作预处理,再对于每一种类的音频,需要提取其每一帧的MFCC倒谱,将提取的倒谱堆叠后输入TDNN网络,得到每一种类音频的声纹特征。第二部分:先对声纹数据进行归一化处理;再运用有标签的归一化后声纹数据作为特征空间训练分类模型Cy;最后在达到训练精度要求后保存模型参数。第三部分:首先使用整合梯度方法计算声纹特征的每个维度在该分类模型中的整合梯度大小,依次来作为其贡献度的指标;接下来,使用类激活映射方法,对特定卷积层输出的特征图的梯度进行全局平均池化,并生成热图;最后将两种方法所得结果结合起来,生成细粒度的可解释性结果。
技术关键词
声纹特征
训练分类模型
梯度方法
全局平均池化
随机梯度下降
映射方法
音频
优化器
滤波器
噪声源
分类网络训练
数据
线性插值方法
样本
标签
特征值
离散余弦变换
水下声源
矩阵
基线
系统为您推荐了相关专利信息
风险预测模型
轻度认知障碍
血管性认知障碍
阿尔茨海默病患者
训练特征
频域均衡方法
滤波器抽头
频域均衡器
误差向量
抽头系数
医疗档案管理方法
语音特征
图像处理模型
高斯混合模型
文本
旅客
智能机场
图像特征向量
高清监控摄像头
构建卷积神经网络
故障诊断方法
注意力神经网络
故障特征
故障类别
异质