摘要
本发明公开了一种音频深度伪造检测方法、装置、终端及存储介质,涉及多媒体信息安全与人工智能技术领域,所述方法通过构建音频深度伪造检测网络模型;根据所述训练集对音频深度伪造检测网络模型进行解耦阶段训练,确定初始训练网络模型;根据训练集对初始训练网络模型进行元学习,确定目标训练网络模型;获取待检测音频,将待检测音频输入目标训练网络模型,确定待检测音频对应的音频类别。由于本发明在音频深度伪造检测网络模型的训练阶段采用元学习,来迫使音频深度伪造检测网络模型学习到更具泛化性的通用知识,因此可以有效地解决现有技术在面对未知声码器和自然场景时,因模型过拟合导致检测性能差的问题。
技术关键词
声码器
音频
网络
编码器
特征提取器
分类器
训练集
阶段
重构
多媒体信息安全
对抗性
模块
参数
融合特征
自然场景
人工智能技术
终端
处理器
可读存储介质
系统为您推荐了相关专利信息
疲劳预测方法
时序神经网络
因子
疲劳监测方法
编码
信号感知方法
音频场景识别
残差模块
短时傅里叶变换
一维卷积神经网络
知识图谱推理
命名实体识别
排序模型
向量检索方法
大语言模型
多模态特征融合
钓鱼网站检测方法
融合特征
元素
序列