摘要
本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。
技术关键词
对抗性
语音活动检测
稀疏音频
增广拉格朗日
ASR系统
语音识别模型
补丁方法
变量
可读存储介质
梯度下降法
数据
噪声
频率
样本
有效性
掩模
处理器
参数
系统为您推荐了相关专利信息
数据智能分类
自然语言文本
对抗性
生成参数
注意力机制
图像重建方法
数学模型
干涉条纹图像
增广拉格朗日
表达式
贴片
粒子群优化算法
干扰方法
纹理
红外图像处理技术
分布式优化算法
分布式协同
增广拉格朗日
优化控制模型
优化控制方法