摘要
本发明包括融合多尺度基频特征和增强注意力的深度伪造语音检测方法,获取语音数据构建模型的训练数据,将获取的训练数据进行预处理分别得到原始波形特征和多尺度基频特征,将特征分别输入到模型中进行模型训练,在检测模型的训练过程中,设置检测模型的超参数,让损失函数不断变小,达到设置的训练次数时得到训练好的检测模型,获取语音数据构建模型的测试数据,分别进行预处理得到原始波形特征和多尺度基频特征,将原始波形特征和多尺度基频特征分别输入到训练好的模型中进行模型测试,在测试过程中,得到语音真伪分类结果,并评估模型的性能,本发明能够有效地提升检测模型的性能。
技术关键词
语音检测方法
波形
Softmax函数
通道
多层感知机
模块
线性
全局平均池化
融合特征
Sinc函数
转换算法
注意力机制
浅层特征提取
连续小波变换
数据
门控循环单元
输入多尺度