一种基于ResUNet的多任务语音恢复方法

正文

推荐专利

申请号：CN202410898854

申请日期：2024-07-05

公开号：CN118737178A

公开日期：2024-10-01

类型：发明专利

摘要

本发明涉及音频数据处理领域，具体涉及一种基于ResUNet的多任务语音恢复方法，包括将采集的干净语音数据和噪声数据进行混合处理得到带噪语音数据；对带噪语音数据进行失真处理，得到退化语音数据；构建基于ResUNet的多任务语音恢复模型，其包括上采样模块、瓶颈层、下采样模块；采用退化语音数据训练多任务语音恢复模型，并采用多分辨率短时傅里叶变换损失函数计算损失；将待处理低质量语音送入训练好的多任务语音恢复模型，生成高质量语音。

技术关键词

语音恢复方法短时傅里叶变换多任务线性单元 GSM传输多分辨率分支采样模块房间脉冲响应级联噪声数据音频数据处理采样率上采样解码通道压缩算法

系统为您推荐了相关专利信息

基于脑电信号和耳温监测的术中病人麻醉状态评估系统

状态评估系统耳温传感器电信号融合特征模糊PID控制器

一种基于数据分析的智能血管通路风险预测方法及系统

风险预测方法血管震颤信号长短期记忆网络

一种基于多模态遥感数据融合的滑坡灾害识别方法及系统

滑坡灾害地基合成孔径雷达多模态光学遥感数据激光雷达数据

一种双阶段神经声码器的语音合成方法、系统、终端及介质

卷积循环神经网络声码器阶段语音短时傅里叶变换

一种中韩双语语音识别与合成系统

引入注意力机制门控循环单元深度学习算法梅尔频率倒谱系数客观评估方法

一种基于ResUNet的多任务语音恢复方法

站点导航

APP 下载