摘要
本发明提供了一种基于持续强化学习的语音攻防博弈自反馈方法及装置,可以应用于人工智能技术领域。该方法包括:将从数据集中获取的样本数据输入到对抗样本生成子模型中,利用对抗样本生成策略对样本数据进行处理,生成语音样本;在语音样本通过质量评估的情况下,将语音样本输入到语音鉴别子模型中,输出对语音样本的鉴别结果;对比鉴别结果与语音样本的真实标签,得到对比结果,对比结果用于反馈调节对抗样本生成策略;在对比结果表征鉴别结果与语音样本的真实标签不同的情况下,将语音样本存储到增量样本集中,并利用持续学习子模型基于增量样本集对语音鉴别子模型进行增量训练。
技术关键词
样本
策略
生成语音
反馈方法
标签
数据
输入模块
人工智能技术
反馈装置
处理器
电子设备
存储器
噪声