一种基于深度学习的抗语音转换和语音合成的声纹表征方法及系统

正文

推荐专利

申请号：CN202510561022

申请日期：2025-04-29

公开号：CN120431939A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种基于深度学习的抗语音转换和语音合成的声纹表征方法及系统。涉及语音识别与生物特征安全领域。包括：步骤1：获取自动说话人验证系统中的输入语音样本信号，并提取语音样本信号的FBANK特征；步骤2：使用卷积神经网络CNN对FBANK特征进行深度特征提取，得到深度特征向量；步骤3：使用递归神经网络RNN处理所述深度特征向量，生成语音的伪造身份向量；步骤4：使用线性判别分析LDA模块对所述伪造身份向量进行分类，输出判定结果。本发明在清洁和噪声环境下均能有效提高伪造检测的准确率。

技术关键词

说话人验证系统表征方法递归神经网络深度特征提取噪声感知训练生成语音频谱特征身份样本信号特征提取模块表征系统生成噪声生成帧线性分类器信噪比

一种基于深度学习的抗语音转换和语音合成的声纹表征方法及系统

站点导航

APP 下载