一种基于双路径Transformer的音频真伪鉴别方法及装置

正文

推荐专利

申请号：CN202510222544

申请日期：2025-02-27

公开号：CN120220726A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种基于双路径Transformer的音频真伪鉴别方法及装置，方法包括以下步骤：预处理：将原始音频信号转换为时频表示，通过LFCC或STFT提取特征得到音频信号的时域特征和频域特征；经过预处理，得到包含时域特征和频域特征时频表示feature＝{B,F,T}，其中B是批量大小，F是频率通道数等于LFCC线性滤波器个数，T是时间帧数；卷积编码器：通过多个2D卷积层对输入的时频表示进行编码，提取局部特征；通过双路径Transformer结构分别处理频域和时域信息，形成语义‑声学信息解耦。通过双路径Transformer结构分别处理频域和时域信息，并结合注意力机制，实现语义信息和声学信息的高效解耦，从而更好地提取和利用不同层面的音频信息。

技术关键词

真伪鉴别方法音频注意力机制卷积编码器卷积解码器时域特征频域特征线性滤波器语义真伪鉴别装置信号频率索引离散余弦变换序列批量

系统为您推荐了相关专利信息

一种基于视觉测量的飞机辅助动力装置管路三维重建方法

深度图飞机辅助动力装置管路三维重建方法多视角监督学习技术

一种过敏原检测模型的构建、过敏原检测方法及烹饪设备

深度学习模型过敏原检测方法烹饪设备序列样本

无人机灌溉信息管理系统及方法

信息管理方法无人机信息管理系统通道注意力机制影像

总线信号逆向工程的深度学习网络模型的训练和应用方法

深度学习网络模型报文计算机程序指令数据信号

一种基于图神经网络学习自适应传播的知识图谱补全方法

知识图谱补全方法邻居关系语义节点特征

一种基于双路径Transformer的音频真伪鉴别方法及装置

站点导航

APP 下载