基于条件扩散模型的语音转换对抗音频生成方法和装置

正文

推荐专利

申请号：CN202411620575

申请日期：2024-11-14

公开号：CN119132309A

公开日期：2024-12-13

类型：发明专利

摘要

本发明公开了基于条件扩散模型的语音转换对抗音频生成方法和装置，包括：准备参考音频样本，基于参考音频样本并采用白盒攻击方式在语音转换任务中生成对抗音频样本，将参考音频样本和对抗音频样本组成样本对；以样本对中的对抗音频样本作为输入，并在样本对中参考音频样本作为引导条件下，对条件扩散模型进行基于对抗音频生成任务的训练；利用训练好条件扩散模型的逆向生成过程，在参考音频样本的引导下生成与参考音频样本相关且用于黑盒语音转换的对抗音频，以解决现有黑盒场景中语音转换对抗音频生成的效率与效果不足的技术问题。

技术关键词

音频生成方法样本语音神经网络参数白盒双曲正切函数模型训练模块因子编码器随机噪声生成装置处理器可读存储介质存储器解码器场景

基于条件扩散模型的语音转换对抗音频生成方法和装置

站点导航

APP 下载