定向拾音方法、系统、设备及存储介质

AITNT
正文
推荐专利
定向拾音方法、系统、设备及存储介质
申请号:CN202510215640
申请日期:2025-02-26
公开号:CN119694333B
公开日期:2025-08-19
类型:发明专利
摘要
本申请提供了一种定向拾音方法、系统、设备及存储介质,涉及拾音领域。该方法包括:麦克风阵列输入的初始语音信号进行MVDR波束成形处理,然后提取语音信号的BFCC特征和基音频率特征。利用预训练的语音/噪声分离DNN对BFCC特征进行处理,得到时频掩码。根据基音频率特征自适应设计梳状滤波器参数,对初始语音信号进行梳状滤波。将时频掩码作为加权系数,分别与梳状滤波后的语音信号和初始语音信号相乘,估计目标语音能量和噪声能量。在Bark频率尺度上计算频率相关的Bark增益系数,用于在时频域对语音信号进行增强。最后,通过逆BFCC变换将增强后的语音信号转换为时域信号,得到指向目标方向的目标增强语音。通过上述方案提高定向拾音效果。
技术关键词
基音频率特征 梳状滤波器 语音 定向拾音方法 波束成形 信号 麦克风阵列 噪声 空间滤波器 卷积神经网络提取 短时傅里叶变换 递归神经网络 离散余弦变换 滤波器系数 可读存储介质 收发器 信噪比
系统为您推荐了相关专利信息
1
基于深度学习的动态知识库客服交互系统
多模态 特征提取单元 分析单元 信息处理模块 交互系统
2
婴儿声音监护方法、系统、相关设备及存储介质
婴儿 监护方法 数据 策略 音频
3
一种动态环境感知的火灾智能疏散系统与方法
智能疏散方法 火灾智能疏散系统 栅格 语音播报系统 动态指示灯
4
一种基于RVC网络的闽南语戏曲变声方法及系统
音频 变声方法 拼音 变声系统 语义
5
一种基于多模态大模型的食品营养成分含量智能评估方法、系统、终端及存储介质
深度学习模型 食品营养成分 多模态 智能评估方法 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号