摘要
本发明公开了一种基于预训练模型的对抗音频样本检测方法、系统、设备及介质,其方法实现包括:获取待检测音频数据;通过预先预训练模型对待检测音频数据进行特征提取,以得到多视角音频特征;通过预先训练完成的多视角对抗音频检测器对多视角音频特征进行特征融合,得到综合特征向量,并对综合特征向量进行分类,以得到待检测音频数据的分类检测结果。通过预训练模型在不同层级提取出包括丰富信息的特征,并通过多视角对抗音频检测器综合各个视角的检测结果,最终输出分类结果,可以有效对抗音频数据进行检测,避免受到对抗攻击的影响,而导致后续声纹认证时容易出现失效的问题,提高声纹识别的有效性。
技术关键词
预训练模型
样本检测方法
音频特征
训练样本数据
多视角
检测器
计算机可读指令
错误率
深层特征提取
浅层特征提取
样本检测系统
声纹认证
数据获取单元
可读存储介质
掩膜
声学特征
系统为您推荐了相关专利信息
音频特征
非线性变换方法
调制特征
数据
融合特征
语句生成方法
数据
人工智能模型
文本
预训练模型
原始图像数据
图像分类方法
卷积神经网络模型
原型
语义特征
双矢量模型预测
训练样本数据
同步电机
模型预测控制算法
BP神经网络模型