摘要
本发明公开了一种音频处理方法、系统、设备及计算机可读存储介质,涉及音频处理技术领域,获取三麦克阵列采集到的原始音频;对原始音频进行波束形成,得到去除旁系音频干扰的初始音频;通过短时傅里叶变换对初始音频中的目标能量帧进行处理,得到时频域的傅里叶音频信号,目标能量帧的值大于设定值;对傅里叶音频信号进行特征提取,得到第一处理结果;根据时间序列的依赖关系,对第一处理结果进行处理,得到第二处理结果;对第二处理结果进行还原,得到维度与傅里叶音频信号一致的目标频谱;通过逆短时傅里叶变换对目标频谱进行处理,得到去除背景噪声的目标音频。本发明可以准确去除原始音频中的旁系音频干扰和背景噪声,提高了音频质量。
技术关键词
短时傅里叶变换
背景噪声
距离信息
运动轨迹信息
阵列
可读存储介质
夹角余弦
波束
信号
通用背景模型
音频特征
视频
频谱特征提取
高斯混合模型
声源特征
主麦克风
偏差