摘要
本发明公开了一种动态多视图融合的语音伪造鉴别方法及装置。所述方法包括以下步骤:根据原始语音信号,获取多视图动态特征数据,构建多视图数据集;采用动态权重聚类集成算法对多视图数据集中的数据进行聚类,生成伪标签;将伪标签与多视图动态特征数据整合,得到第一增强数据集,训练K近邻分类器;利用训练好的K近邻分类器对需要鉴别的语音信号中原始语音信号之外的未见数据点进行预测。本发明采用无监督学习挖掘多视角语音信息,解决了现有方法在泛化、鲁棒及特征利用上的不足。本发明在多数据集上性能卓越,关键指标显著提升,面对不同伪造数据点泛化与鲁棒性强,为语音深度伪造检测提供新路径。
技术关键词
K近邻分类器
数据
鉴别方法
语音生成模型
声学特征
重构误差
动态
集成算法
信号
标签
信息熵
贝叶斯概率模型
邻居
音频编码
加权欧氏距离
均值聚类算法
拉普拉斯
系统为您推荐了相关专利信息
权重分配机制
考评系统
组织
数据处理方法
自然语言文本
负荷分析方法
空间聚类算法
矩阵
分类器
拉普拉斯