基于条件扩散模型的语音转换对抗音频生成方法和装置

AITNT
正文
推荐专利
基于条件扩散模型的语音转换对抗音频生成方法和装置
申请号:CN202411620575
申请日期:2024-11-14
公开号:CN119132309A
公开日期:2024-12-13
类型:发明专利
摘要
本发明公开了基于条件扩散模型的语音转换对抗音频生成方法和装置,包括:准备参考音频样本,基于参考音频样本并采用白盒攻击方式在语音转换任务中生成对抗音频样本,将参考音频样本和对抗音频样本组成样本对;以样本对中的对抗音频样本作为输入,并在样本对中参考音频样本作为引导条件下,对条件扩散模型进行基于对抗音频生成任务的训练;利用训练好条件扩散模型的逆向生成过程,在参考音频样本的引导下生成与参考音频样本相关且用于黑盒语音转换的对抗音频,以解决现有黑盒场景中语音转换对抗音频生成的效率与效果不足的技术问题。
技术关键词
音频生成方法 样本 语音 神经网络参数 白盒 双曲正切函数 模型训练模块 因子 编码器 随机噪声 生成装置 处理器 可读存储介质 存储器 解码器 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号