摘要
本发明提供了一种飞行话音降噪方法、装置、设备及介质,包括:构建飞行话音降噪模型,并对降噪模型进行训练;通过训练后的降噪模型对获取的飞行语音数据进行降噪处理,输出降噪后的飞行语音;降噪模型通过短时傅里叶变换提取飞行语音数据频谱域的虚实部特征,并提取Mel频谱特征;将Mel频谱特征和频谱域的虚实部特征拼接后进行编码;将编码后的特征与Mel频谱特征进行融合,将融合特征由中间层建模时序特性,通过跳跃连接输入解码器,生成降噪后的频谱特征;将降噪后的频谱特征通过逆短时傅里叶变换转换为降噪后的时域语音信号,获得降噪后的飞行语音。本发明能够在复杂的飞行环境下实现高效降噪,同时提高降噪后语音的清晰度和主观音质。
技术关键词
话音降噪方法
频谱特征
降噪模型
短时傅里叶变换
融合特征
语音
预训练模型
输入解码器
联合损失函数
中间层
注意力机制
多层卷积神经网络
数据
可读存储介质
降噪装置
时序
编码器