摘要
本发明提出一种基于自注意力机制的多通道音频处理的实时降噪方法,该方法包括:对每一预处理后的音频数据分别进行短时傅里叶变换,得到每一帧信号的频谱,并对频谱的幅度取对数,得到每一音频数据对应的语谱图,并进一步得到初始多通道语谱图;根据各类型噪音对应的标准语谱图,与初始多通道语谱图进行匹配,根据匹配结果对初始多通道语谱图进行优化,得到优化后的多通道语谱图;将优化后的多通道语谱图输入到基于稀疏矩阵的多头自注意力机制降噪模型中,得到降噪后的多通道语谱图;根据降噪后的多通道语谱图,得到降噪后音频信号。本发明对实时场景下采集的音频数据进行降噪处理,有效提高音频数据的降噪效果,以提高在线客服系统的准确性。
技术关键词
语谱图
多通道
注意力机制
降噪方法
短时傅里叶变换
降噪模型
在线客服系统
时域音频信号
线性变换矩阵
场景
融合特征
前馈神经网络
数据
加权特征
系统为您推荐了相关专利信息
情感分类系统
情感分类模型
特征提取模块
语义特征提取
词嵌入向量
学检测方法
降噪方法
信号
Akaike信息准则
音频
分布式时序数据库
电网设备状态
异常检测方法
拓扑图
分区