摘要
本发明公开了一种基于时频特征联合建模的语音增强方法及系统,涉及语音增强技术领域,包括:获取待增强的失真语音信号;对失真语音信号进行短时傅里叶变换,得到幅度谱和相位谱,并从中提取时频特征;通过编码器对时频特征进行编码,以提高语义维度和时间感受野,生成编码时频特征;将编码时频特征输入至时频建模模块中,依次对时间维度与频率维度进行特征建模,以捕获语音信号中的时间动态信息与频率结构依赖,生成时频联合建模特征;将时频联合建模特征分别输入至并行的幅度解码器和相位解码器中,输出预测的干净语音幅度谱和相位谱,再通过反短时傅里叶变换还原为增强语音波形。本发明可重构出质量更优的增强的语音信号。
技术关键词
短时傅里叶变换
语音
解码器
卷积特征
频率
编码器
压缩特征
短时傅立叶变换
计算机程序产品
编码特征
可读存储介质
卷积模块
信号获取模块
波形
指令
语义
特征提取模块
系统为您推荐了相关专利信息
区域划分方法
尘肺病
编码器特征
关键点
区域划分系统
地表温度反演方法
发射率
归一化植被指数
矩阵
卫星遥感影像数据
供暖设备
室内环境参数
远程服务器
控制策略
数据处理单元
冰冻切片
辅助诊断方法
HE染色
图像
神经网络模型
语音识别方法
特征向量值
英语
音频
训练识别模型