摘要
本申请提供了一种定向拾音方法、系统、设备及存储介质,涉及拾音领域。该方法包括:麦克风阵列输入的初始语音信号进行MVDR波束成形处理,然后提取语音信号的BFCC特征和基音频率特征。利用预训练的语音/噪声分离DNN对BFCC特征进行处理,得到时频掩码。根据基音频率特征自适应设计梳状滤波器参数,对初始语音信号进行梳状滤波。将时频掩码作为加权系数,分别与梳状滤波后的语音信号和初始语音信号相乘,估计目标语音能量和噪声能量。在Bark频率尺度上计算频率相关的Bark增益系数,用于在时频域对语音信号进行增强。最后,通过逆BFCC变换将增强后的语音信号转换为时域信号,得到指向目标方向的目标增强语音。通过上述方案提高定向拾音效果。
技术关键词
基音频率特征
梳状滤波器
语音
定向拾音方法
波束成形
信号
麦克风阵列
噪声
空间滤波器
卷积神经网络提取
短时傅里叶变换
递归神经网络
离散余弦变换
滤波器系数
可读存储介质
收发器
信噪比
系统为您推荐了相关专利信息
多模态
特征提取单元
分析单元
信息处理模块
交互系统
智能疏散方法
火灾智能疏散系统
栅格
语音播报系统
动态指示灯
深度学习模型
食品营养成分
多模态
智能评估方法
融合特征