基于自注意力机制的多通道音频处理的实时降噪方法

正文

推荐专利

申请号：CN202510340100

申请日期：2025-03-21

公开号：CN120183427A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提出一种基于自注意力机制的多通道音频处理的实时降噪方法，该方法包括：对每一预处理后的音频数据分别进行短时傅里叶变换，得到每一帧信号的频谱，并对频谱的幅度取对数，得到每一音频数据对应的语谱图，并进一步得到初始多通道语谱图；根据各类型噪音对应的标准语谱图，与初始多通道语谱图进行匹配，根据匹配结果对初始多通道语谱图进行优化，得到优化后的多通道语谱图；将优化后的多通道语谱图输入到基于稀疏矩阵的多头自注意力机制降噪模型中，得到降噪后的多通道语谱图；根据降噪后的多通道语谱图，得到降噪后音频信号。本发明对实时场景下采集的音频数据进行降噪处理，有效提高音频数据的降噪效果，以提高在线客服系统的准确性。

技术关键词

语谱图多通道注意力机制降噪方法短时傅里叶变换降噪模型在线客服系统时域音频信号线性变换矩阵场景融合特征前馈神经网络数据加权特征

系统为您推荐了相关专利信息

一种改进ResNet18的玉米叶片病害分类方法

分类方法神经网络模型叶片图像残差模块

基于深度学习的方面情感分类系统

情感分类系统情感分类模型特征提取模块语义特征提取词嵌入向量

用于边缘计算的零信任联邦学习的安全训练方法及装置

客户端恢复算法加密密钥交换算法生成算法

一种适用于低信噪比环境的钢管混凝土脱空敲击声学检测方法

学检测方法降噪方法信号 Akaike信息准则音频

电网设备异常检测方法及系统

分布式时序数据库电网设备状态异常检测方法拓扑图分区

基于自注意力机制的多通道音频处理的实时降噪方法

站点导航

APP 下载