摘要
本申请公开了一种伪造语音检测方法及系统,涉及语音识别技术领域,该方法包括提取待检测语音的时序一致性特征,所述时序一致性特征包括音高波动特征、能量变化特征;提取待检测语音的声学特征,所述声学特征包括线性频率倒谱系数频谱特征;将时序一致性特征和声学特征拼接形成多通道特征;将多通道特征输入基于AASIST的部分伪造语音检测模型,进行编码、图建模和分类处理,输出部分伪造语音的检测结果,本申请基于AASIST的部分伪造语音检测模型根据时序一致性特征和声学特征融合的多通道特征,通过分析语音信号的局部时序异常和说话人声学特征不一致性,实现对部分伪造语音的精准检测。
技术关键词
语音检测方法
多通道特征
声学特征
波动特征
频谱特征
线性滤波器
节点
时序
特征提取模块
异构
语音检测系统
隐马尔科夫模型
序列
滑动窗口机制
输出特征
注意力参数
信号
卷积编码器