一种基于融合空间特征的多通道语音增强方法

正文

推荐专利

申请号：CN202411674055

申请日期：2024-11-21

公开号：CN119446166A

公开日期：2025-02-14

类型：发明专利

摘要

本发明公开了一种基于融合空间特征的多通道语音增强方法，首先从带噪多通道语音中分别提取多通道复频谱特征和融合空间特征，再将提取的多通道复频谱特征和融合空间特征输入深度神经网络进行处理并设定处理目标为理想复值比率掩蔽，再构建基于复卷积编码器解码器结构的深度复卷积循环语音增强网络，再利用深度复卷积循环语音增强网络对多通道复频谱特征和融合空间特征进行处理，输出预测复值比率掩蔽。本发明充分整合光谱信息、方向特征、通道间特征和相关系数特征，并对动态声源进行空间建模，使得网络对于语音信号的理解和处理能力远超传统方法，能够有效应对复杂多变的语音场景，有效地提升静态场景和动态场景下的语音增强效果。

技术关键词

多通道频谱特征语音比率短时傅里叶变换卷积编码器解码器结构深度神经网络编码器模块密集特征多分辨率波形麦克风相位特征方位角动态场景索引频率

系统为您推荐了相关专利信息

声纹结果矫正方法、控制器、车辆和计算机可读存储介质

声纹特征矫正方法对象可读存储介质语音识别功能

一种多通道幅相延迟控制装置

延迟控制装置逻辑处理单元监测单元链路多通道

一种基于人体姿态评估的驾驶员监测系统

驾驶员监测系统数据采集模块显示端语音传输功能人脸特征检测

基于多智能体协作的视频生成方法、装置及智能体

多智能体协作视频生成方法元素风格对象

一种基于梯媒的多元智能融合分析方法、系统及终端

多元智能融合智能语音终端自然灾害分析方法高性能处理器

一种基于融合空间特征的多通道语音增强方法

站点导航

APP 下载