摘要
本发明公开了一种基于深度学习的抗语音转换和语音合成的声纹表征方法及系统。涉及语音识别与生物特征安全领域。包括:步骤1:获取自动说话人验证系统中的输入语音样本信号,并提取语音样本信号的FBANK特征;步骤2:使用卷积神经网络CNN对FBANK特征进行深度特征提取,得到深度特征向量;步骤3:使用递归神经网络RNN处理所述深度特征向量,生成语音的伪造身份向量;步骤4:使用线性判别分析LDA模块对所述伪造身份向量进行分类,输出判定结果。本发明在清洁和噪声环境下均能有效提高伪造检测的准确率。
技术关键词
说话人验证系统
表征方法
递归神经网络
深度特征提取
噪声感知训练
生成语音
频谱特征
身份
样本
信号
特征提取模块
表征系统
生成噪声
生成帧
线性
分类器
信噪比