摘要
本申请公开了一种基于语谱特征和深度学习的部分伪造语音检测方法及系统,涉及语音真伪检测技术领域,解决了现有的伪造语音检测方法无法有效检测携带短小伪造片段的伪造语音,从而检测准确率性较低的问题,该方法包括提取语音的梅尔语谱图,并将梅尔语谱图按时间方向划分成多个语谱子图;将所述多个语谱子图输入到预先训练的由线性投影层、Transformer编码器网络和xLSTM判别器网络构成的深度学习伪造语音检测模型中,得到代表对应各语谱子图的真实分数;融合各语谱子图的真实分数获得话语级别真实分数,从而得到检测结果,能学习语音谱图的深层表征,并有效捕获真假语音分段之间的差异,从而实现部分伪造语音的高准确率检测。
技术关键词
语音检测方法
语音标签
语音检测系统
子模块
模型训练模块
音频
样本
分段
序列
梯度下降算法
前馈神经网络
图谱
编码器
可读存储介质
特征提取模块
语音特征
参数
系统为您推荐了相关专利信息
历史监测数据
数据预测方法
数据预测系统
监测设备
实时监测数据
传感器老化
分类模型训练
校准方法
参数校准
监测站