摘要
本发明涉及音频数据处理领域,具体涉及一种基于ResUNet的多任务语音恢复方法,包括将采集的干净语音数据和噪声数据进行混合处理得到带噪语音数据;对带噪语音数据进行失真处理,得到退化语音数据;构建基于ResUNet的多任务语音恢复模型,其包括上采样模块、瓶颈层、下采样模块;采用退化语音数据训练多任务语音恢复模型,并采用多分辨率短时傅里叶变换损失函数计算损失;将待处理低质量语音送入训练好的多任务语音恢复模型,生成高质量语音。
技术关键词
语音恢复方法
短时傅里叶变换
多任务
线性单元
GSM传输
多分辨率
分支
采样模块
房间脉冲响应
级联
噪声数据
音频数据处理
采样率
上采样
解码
通道
压缩算法
系统为您推荐了相关专利信息
状态评估系统
耳温传感器
电信号
融合特征
模糊PID控制器
滑坡灾害
地基合成孔径雷达
多模态
光学遥感数据
激光雷达数据
卷积循环神经网络
声码器
阶段
语音
短时傅里叶变换
引入注意力机制
门控循环单元
深度学习算法
梅尔频率倒谱系数
客观评估方法