摘要
本申请属于音频数据处理技术领域,涉及一种基于声学遮蔽的伪音色对抗AI语音克隆的方法及系统,该方法包括:步骤S1、基于给定的音频文件素材的音调特征构建伪音色;步骤S2、根据目标音频的强度和频谱特征确定目标音频的掩蔽阈值,将功率低于掩蔽阈值的频段标记为不可闻频段;步骤S3、将所述伪音色嵌入到目标音频的不可闻频段,获得合成音频。本申请能够在不影响音质的前提下实现对AI语音克隆的主动防御,具备较高的通用性和鲁棒性,能够抵御多种语音克隆攻击。
技术关键词
掩蔽阈值
AI语音
频段
梅尔频率倒谱系数
音色特征
频谱特征
音频数据处理技术
索引
字典
功率
模块
标记
谐波
鲁棒性
强度
信号
系统为您推荐了相关专利信息
风险评估方法
双频段
X波段雷达
Kalman滤波算法
随机森林模型
人防工程
信号处理模块
多频段天线
通信设备
电源接口模块
网格
地理兴趣点
载波相位偏差
生成磁场
挖掘方法