语音鉴伪模型的训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411129480

申请日期：2024-08-16

公开号：CN119028322B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及一种语音鉴伪模型的训练方法，通过获取第一预设数量的虚假音频，获取第二预设数量的真实音频。再通过whisper预训练模型、hubert预训练模型和wav2vec2.0预训练模型分别提取虚假音频与真实音频的中间特征、时长特征与抽象特征。将中间特征、时长特征和抽象特征进行融合，生成融合特征，将融合特征输入专家模型和门控网络，得到专家模型输出与专家模型输出的权重。根据专家模型输出与专家模型输出的权重训练专家模型与门控网络，得到语音鉴伪模型。本发明结合多种预训练模型提取多层次特征，并通过Attention机制进行特征融合，可以增强模型对不同类型伪造语音的适应性，从而提高泛化能力。

技术关键词

融合特征语音音频 Attention机制网络训练设备训练装置多头注意力机制多层次特征模型训练模块预训练模型特征提取模块处理器程序存储器标签噪声参数数据

语音鉴伪模型的训练方法、装置、设备及存储介质

站点导航

APP 下载