基于自注意力机制的多通道音频处理的实时降噪方法

AITNT
正文
推荐专利
基于自注意力机制的多通道音频处理的实时降噪方法
申请号:CN202510340100
申请日期:2025-03-21
公开号:CN120183427A
公开日期:2025-06-20
类型:发明专利
摘要
本发明提出一种基于自注意力机制的多通道音频处理的实时降噪方法,该方法包括:对每一预处理后的音频数据分别进行短时傅里叶变换,得到每一帧信号的频谱,并对频谱的幅度取对数,得到每一音频数据对应的语谱图,并进一步得到初始多通道语谱图;根据各类型噪音对应的标准语谱图,与初始多通道语谱图进行匹配,根据匹配结果对初始多通道语谱图进行优化,得到优化后的多通道语谱图;将优化后的多通道语谱图输入到基于稀疏矩阵的多头自注意力机制降噪模型中,得到降噪后的多通道语谱图;根据降噪后的多通道语谱图,得到降噪后音频信号。本发明对实时场景下采集的音频数据进行降噪处理,有效提高音频数据的降噪效果,以提高在线客服系统的准确性。
技术关键词
语谱图 多通道 注意力机制 降噪方法 短时傅里叶变换 降噪模型 在线客服系统 时域音频信号 线性变换矩阵 场景 融合特征 前馈神经网络 数据 加权特征
系统为您推荐了相关专利信息
1
一种改进ResNet18的玉米叶片病害分类方法
分类方法 神经网络模型 叶片 图像 残差模块
2
基于深度学习的方面情感分类系统
情感分类系统 情感分类模型 特征提取模块 语义特征提取 词嵌入向量
3
用于边缘计算的零信任联邦学习的安全训练方法及装置
客户端 恢复算法 加密 密钥交换算法 生成算法
4
一种适用于低信噪比环境的钢管混凝土脱空敲击声学检测方法
学检测方法 降噪方法 信号 Akaike信息准则 音频
5
电网设备异常检测方法及系统
分布式时序数据库 电网设备状态 异常检测方法 拓扑图 分区
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号