摘要
本发明涉及语言转换技术领域,具体涉及一种基于图卷积网络的匿名说话人攻击方法;包括如下步骤:将F0特征与原始F0特征进行拼接融合作为新F0特征;提取音频的特征并进行矢量量化;将处理后的F0特征和特征进行拼接,生成匿名化语音;计算来自试验话语和注册话语的说话者嵌入;输出匿名化试验话语嵌入和匿名化注册话语嵌入的相似性分数,根据分数判断是否属于同一说话人;通过多个试验和注册话语对,计算等错误率作为性能指标,评估攻击者系统对匿名化系统的攻击能力;通过考虑F0特征不同帧之间的时间相关性,利用图卷积网络和F0特征协同匿名说话人身份信息,来提升攻击者系统性能。
技术关键词
特征提取器
矢量量化
网络
说话人身份信息
语言转换技术
合成器
错误率
预训练模型
语音
嵌入特征
音频
批量
瓶颈
波形
线性
矩阵
算法
数据
系统为您推荐了相关专利信息
数据适配系统
医院
在线增量学习
多模态数据融合
多粒度特征
主动防御系统
自组网通信模块
时钟同步模块
分布式设备
反制功能
能源管理
测控系统
控制执行模块
混合整数规划
控制模块
地下水超采区
水位预警方法
预警模型
地下水水位变化
神经网络参数