基于时频特征联合建模的语音增强方法及系统

AITNT
正文
推荐专利
基于时频特征联合建模的语音增强方法及系统
申请号:CN202511070132
申请日期:2025-07-31
公开号:CN120636435A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于时频特征联合建模的语音增强方法及系统,涉及语音增强技术领域,包括:获取待增强的失真语音信号;对失真语音信号进行短时傅里叶变换,得到幅度谱和相位谱,并从中提取时频特征;通过编码器对时频特征进行编码,以提高语义维度和时间感受野,生成编码时频特征;将编码时频特征输入至时频建模模块中,依次对时间维度与频率维度进行特征建模,以捕获语音信号中的时间动态信息与频率结构依赖,生成时频联合建模特征;将时频联合建模特征分别输入至并行的幅度解码器和相位解码器中,输出预测的干净语音幅度谱和相位谱,再通过反短时傅里叶变换还原为增强语音波形。本发明可重构出质量更优的增强的语音信号。
技术关键词
短时傅里叶变换 语音 解码器 卷积特征 频率 编码器 压缩特征 短时傅立叶变换 计算机程序产品 编码特征 可读存储介质 卷积模块 信号获取模块 波形 指令 语义 特征提取模块
系统为您推荐了相关专利信息
1
一种尘肺病肺野分割与区域划分方法、系统与存储介质
区域划分方法 尘肺病 编码器特征 关键点 区域划分系统
2
一种用于非洲沙漠地区地表温度反演方法
地表温度反演方法 发射率 归一化植被指数 矩阵 卫星遥感影像数据
3
一种供暖设备智能化自动调节及远程诊断系统
供暖设备 室内环境参数 远程服务器 控制策略 数据处理单元
4
一种无需HE染色的数字化冰冻切片术中快速辅助诊断方法
冰冻切片 辅助诊断方法 HE染色 图像 神经网络模型
5
一种多英语口音的语音识别方法及系统
语音识别方法 特征向量值 英语 音频 训练识别模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号