基于频域与时域知识提取的低质量压缩语音深度伪造检测方法

正文

推荐专利

申请号：CN202411020089

申请日期：2024-07-29

公开号：CN119049508A

公开日期：2024-11-29

类型：发明专利

摘要

基于频域与时域知识提取的低质量压缩语音深度伪造检测方法，涉及多媒体信息安全技术领域。技术方案：采用六种有损压缩算法对训练数据集进行压缩，从而得到与高质量训练集匹配的低质量数据，使用预训练的大模型XLS‑R从语音数据中提取特征，使用高质量的原始数据训练教师模型，使用低质量压缩数据，通过频域蒸馏和时域蒸馏训练学生模型。有益效果：本发明采用知识蒸馏作为主要框架，使用数据蒸馏的方式，用高质量数据去训练教师模型，低质量数据去训练学生模型，然后采用频域和时域蒸馏，使得学生模型可以从教师模型那学到压缩数据丢失的频域和时域信息，从而提高低质量数据的伪造检测性能，有效识别和打击伪造语音，维护语音信息的真实性和安全性。

技术关键词

蒸馏音频特征学生教师有损压缩算法语音特征提取多媒体信息安全技术数据样本频域特征定义中间层代表模块训练集度量网络传播算法

系统为您推荐了相关专利信息

一种基于知识图谱的膳食调整系统及方法

健康知识图谱健康状态分析注意力知识图谱构建知识蒸馏技术

一种基于AI的外语教学授课效果评估方法及系统

信息熵文本段落序列句法结构偏差

一种医学图像分割模型知识蒸馏方法及系统

医学图像分割模型知识蒸馏方法解码器教师学生

物品信息分析模型的生成方法、生成装置和电子设备

大语言模型生成方法数据样本标签

一种基于多模态的审讯对象情绪变化的识别方法

视频特征向量识别方法视频特征提取多模态交叉注意力机制

基于频域与时域知识提取的低质量压缩语音深度伪造检测方法

站点导航

APP 下载