摘要
本申请公开了一种结合非负矩阵分解与时频掩蔽的语音降噪方法、装置及存储介质,属于蓝牙音频技术领域,该方法包括:输入单声道语音PCM数据,并执行低延迟改进型离散余弦变换,得到MDCT谱系数;根据MDCT谱系数,计算子带能量,并构建带噪语音幅度谱观察矩阵;对带噪语音幅度谱观察矩阵执行非负矩阵分解,计算NMF幅度谱增益;根据子带能量,执行特征提取,并通过预训练的深度神经网络计算NN幅度谱增益;将NMF幅度谱增益和NN幅度谱增益进行融合,输出降噪增益;根据降噪增益和MDCT谱系数,得到降噪谱系数;以及根据降噪谱系数,继续执行编码过程,输出降噪语音码流。本申请基于MDCT谱系数,通过结合非负矩阵分解与时频掩蔽实现语音降噪,保证了音质。
技术关键词
改进型离散余弦变换
语音降噪方法
深度神经网络
矩阵
低延迟
噪声
蓝牙音频技术
语音降噪装置
索引表
基础
模块
计算机
编码
数据
可读存储介质
训练集
指令
波形
系统为您推荐了相关专利信息
机载MIMO雷达
OMP算法
杂波协方差矩阵
干扰抑制模块
降维算法
网格搜索算法
参数
水电机组状态
支持向量机模型
径向基核函数
协作机器人
深度学习模型
定位成功率
解码成功率
指标
调度优化模型
图灵斑图
协同进化算法
矩阵
工作机器
底盘控制方法
递推最小二乘法
焊接机器人
辨识算法
参数