摘要
本发明公开了一种基于跨模态正交解耦的零知识真伪语音检测方法、系统、电子设备及存储介质,包括:获取待检测的输入语音,提取出输入语音的混合特征X和语义特征xsem,所述混合特征X包含语义信息和声学信息;将语义特征xsem与混合特征X进行跨模态对齐,得到对齐后的语义特征基于对齐后的语义特征对混合特征X进行正交分解,仅保留混合特征X中的声学信息,并生成对应的纯声学特征xaco;对纯声学特征xaco进行特征优化,并将特征优化后的纯声学特征xaco输入预先训练好的真伪检测模型中,得到对应的全局声学特征表示。本方法仅利用声学信息进行检测,解决了现有技术中隐私泄露与检测效率难以兼顾的问题。
技术关键词
声学特征
语音检测方法
语义特征
跨模态
计算机执行指令
前馈神经网络
语音检测系统
Sigmoid函数
线性变换矩阵
BERT模型
编码器参数
电子设备
可读存储介质
特征提取模块
对齐模块
计算机程序产品
重构误差