摘要
本发明涉及音频检测领域,提出一种融合多源特征与跨尺度建模的音频深度伪造检测方法及系统,通过双分支数据增强策略,有效提高了对合成样本中隐蔽伪造模式的识别能力,在保持语音自然性与听觉可接受性的同时,引入具有代表性的伪造扰动空间,从而显著提高了在多类型深度伪造攻击下的泛化与鲁棒性,再分别获取多层次深度音频特征和物理声学特征并进行特征融合,提高了对物理层伪影的敏感度,进一步提高了检测准确性,还通过多尺度注意力增强,高效捕捉伪造音频中跨时间与频率尺度的微弱变化特征,通过分组卷积与多分支注意力路径的结构设计,有效整合了局部与全局感知信息,本发明提高了音频深度伪造检测的准确性、鲁棒性和泛化能力。
技术关键词
深度音频特征
融合多源特征
声学特征
多尺度
多层次
融合特征
伪影
分支
通道注意力机制
数据
子带能量特征
支路
语音
音频特征提取
深度特征提取
策略
融合算法
全局平均池化
系统为您推荐了相关专利信息
状态检测方法
图像识别技术
解码模块
颜色
注意力
轻量级卷积神经网络
缺陷检测方法
瓦楞纸箱
金字塔网络
注意力机制
主板检测方法
神经网络模型
瓶颈结构
多尺度特征金字塔
图像
恶意代码检测方法
多层次特征融合
图像
序列特征
稀疏特征向量
多尺度特征提取
纹理特征
图像
焊缝检测方法
管道机器人