一种融合多源特征与跨尺度建模的音频深度伪造检测方法

正文

推荐专利

申请号：CN202511294644

申请日期：2025-09-11

公开号：CN120783799B

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及音频检测领域，提出一种融合多源特征与跨尺度建模的音频深度伪造检测方法及系统，通过双分支数据增强策略，有效提高了对合成样本中隐蔽伪造模式的识别能力，在保持语音自然性与听觉可接受性的同时，引入具有代表性的伪造扰动空间，从而显著提高了在多类型深度伪造攻击下的泛化与鲁棒性，再分别获取多层次深度音频特征和物理声学特征并进行特征融合，提高了对物理层伪影的敏感度，进一步提高了检测准确性，还通过多尺度注意力增强，高效捕捉伪造音频中跨时间与频率尺度的微弱变化特征，通过分组卷积与多分支注意力路径的结构设计，有效整合了局部与全局感知信息，本发明提高了音频深度伪造检测的准确性、鲁棒性和泛化能力。

技术关键词

深度音频特征融合多源特征声学特征多尺度多层次融合特征伪影分支通道注意力机制数据子带能量特征支路语音音频特征提取深度特征提取策略融合算法全局平均池化

系统为您推荐了相关专利信息

一种基于图像识别技术的口腔状态检测方法及系统

状态检测方法图像识别技术解码模块颜色注意力

基于轻量级卷积神经网络和持续学习缺陷检测方法

轻量级卷积神经网络缺陷检测方法瓦楞纸箱金字塔网络注意力机制

一种基于人工智能的特种主板检测方法及系统

主板检测方法神经网络模型瓶颈结构多尺度特征金字塔图像

基于多层次特征融合的恶意代码检测方法、系统及设备

恶意代码检测方法多层次特征融合图像序列特征稀疏特征向量

基于深度学习的焊缝检测方法、装置

多尺度特征提取纹理特征图像焊缝检测方法管道机器人

一种融合多源特征与跨尺度建模的音频深度伪造检测方法

站点导航

APP 下载