摘要
本发明公开了一种融合盲源分离和轻量化模型的双通道语音增强方法,采集初始信号并按照信噪比调整噪声强度生成含噪语音信号,并根据含噪语音信号的噪声强度划分为低信噪比场景和极低信噪比场景;对含噪语音信号进行处理,得到时频域特征,在低信噪比、极低信噪比场景下,分别采用AuxIVA算法和OGIVEa_NG算法对时频域特征进行盲源分离,生成辅助特征信息;将辅助特征信息与时频域特征融合后,分别输入GTCRN模型和轻量化语音增强模型DPCRN进行增强,得到增强后的语音信号。本发明通过GTCRN模型和轻量化语音增强模型DPCRN的双通道语音增强技术,能够有效分离语音信号和噪声信号,提升语音的清晰度和可懂度。
技术关键词
双路卷积神经网络
频域特征
语音
短时傅里叶变换
编码器
解码器
信噪比
信号
噪声强度
混合矩阵
传声器阵列
频率
混响时间
时序
场景
算法
协方差矩阵
噪声数据
系统为您推荐了相关专利信息
卷积网络模型
数据编码器
解码器
编码特征
注意力
可见光图像
多模态图像融合模型
基础
特征提取对图像
解码器
图像修复方法
生成对抗网络
注意力
Sigmoid函数
对齐模块
公益
加密数据
数据加密存储方法
存储装置
数据主体