基于时频特征联合建模的语音增强方法及系统

正文

推荐专利

申请号：CN202511070132

申请日期：2025-07-31

公开号：CN120636435A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于时频特征联合建模的语音增强方法及系统，涉及语音增强技术领域，包括：获取待增强的失真语音信号；对失真语音信号进行短时傅里叶变换，得到幅度谱和相位谱，并从中提取时频特征；通过编码器对时频特征进行编码，以提高语义维度和时间感受野，生成编码时频特征；将编码时频特征输入至时频建模模块中，依次对时间维度与频率维度进行特征建模，以捕获语音信号中的时间动态信息与频率结构依赖，生成时频联合建模特征；将时频联合建模特征分别输入至并行的幅度解码器和相位解码器中，输出预测的干净语音幅度谱和相位谱，再通过反短时傅里叶变换还原为增强语音波形。本发明可重构出质量更优的增强的语音信号。

技术关键词

短时傅里叶变换语音解码器卷积特征频率编码器压缩特征短时傅立叶变换计算机程序产品编码特征可读存储介质卷积模块信号获取模块波形指令语义特征提取模块

系统为您推荐了相关专利信息

一种尘肺病肺野分割与区域划分方法、系统与存储介质

区域划分方法尘肺病编码器特征关键点区域划分系统

一种用于非洲沙漠地区地表温度反演方法

地表温度反演方法发射率归一化植被指数矩阵卫星遥感影像数据

一种供暖设备智能化自动调节及远程诊断系统

供暖设备室内环境参数远程服务器控制策略数据处理单元

一种无需HE染色的数字化冰冻切片术中快速辅助诊断方法

冰冻切片辅助诊断方法 HE染色图像神经网络模型

一种多英语口音的语音识别方法及系统

语音识别方法特征向量值英语音频训练识别模型

基于时频特征联合建模的语音增强方法及系统

站点导航

APP 下载