定向拾音方法、系统、设备及存储介质

正文

推荐专利

定向拾音方法、系统、设备及存储介质

申请号：CN202510215640

申请日期：2025-02-26

公开号：CN119694333B

公开日期：2025-08-19

类型：发明专利

摘要

本申请提供了一种定向拾音方法、系统、设备及存储介质，涉及拾音领域。该方法包括：麦克风阵列输入的初始语音信号进行MVDR波束成形处理,然后提取语音信号的BFCC特征和基音频率特征。利用预训练的语音/噪声分离DNN对BFCC特征进行处理,得到时频掩码。根据基音频率特征自适应设计梳状滤波器参数,对初始语音信号进行梳状滤波。将时频掩码作为加权系数,分别与梳状滤波后的语音信号和初始语音信号相乘,估计目标语音能量和噪声能量。在Bark频率尺度上计算频率相关的Bark增益系数,用于在时频域对语音信号进行增强。最后,通过逆BFCC变换将增强后的语音信号转换为时域信号,得到指向目标方向的目标增强语音。通过上述方案提高定向拾音效果。

技术关键词

基音频率特征梳状滤波器语音定向拾音方法波束成形信号麦克风阵列噪声空间滤波器卷积神经网络提取短时傅里叶变换递归神经网络离散余弦变换滤波器系数可读存储介质收发器信噪比

系统为您推荐了相关专利信息

基于深度学习的动态知识库客服交互系统

多模态特征提取单元分析单元信息处理模块交互系统

婴儿声音监护方法、系统、相关设备及存储介质

婴儿监护方法数据策略音频

一种动态环境感知的火灾智能疏散系统与方法

智能疏散方法火灾智能疏散系统栅格语音播报系统动态指示灯

一种基于RVC网络的闽南语戏曲变声方法及系统

音频变声方法拼音变声系统语义

一种基于多模态大模型的食品营养成分含量智能评估方法、系统、终端及存储介质

深度学习模型食品营养成分多模态智能评估方法融合特征

定向拾音方法、系统、设备及存储介质

站点导航

APP 下载