一种基于ResUNet的多任务语音恢复方法

AITNT
正文
推荐专利
一种基于ResUNet的多任务语音恢复方法
申请号:CN202410898854
申请日期:2024-07-05
公开号:CN118737178A
公开日期:2024-10-01
类型:发明专利
摘要
本发明涉及音频数据处理领域,具体涉及一种基于ResUNet的多任务语音恢复方法,包括将采集的干净语音数据和噪声数据进行混合处理得到带噪语音数据;对带噪语音数据进行失真处理,得到退化语音数据;构建基于ResUNet的多任务语音恢复模型,其包括上采样模块、瓶颈层、下采样模块;采用退化语音数据训练多任务语音恢复模型,并采用多分辨率短时傅里叶变换损失函数计算损失;将待处理低质量语音送入训练好的多任务语音恢复模型,生成高质量语音。
技术关键词
语音恢复方法 短时傅里叶变换 多任务 线性单元 GSM传输 多分辨率 分支 采样模块 房间脉冲响应 级联 噪声数据 音频数据处理 采样率 上采样 解码 通道 压缩算法
系统为您推荐了相关专利信息
1
基于脑电信号和耳温监测的术中病人麻醉状态评估系统
状态评估系统 耳温传感器 电信号 融合特征 模糊PID控制器
2
一种基于数据分析的智能血管通路风险预测方法及系统
风险预测方法 血管 震颤 信号 长短期记忆网络
3
一种基于多模态遥感数据融合的滑坡灾害识别方法及系统
滑坡灾害 地基合成孔径雷达 多模态 光学遥感数据 激光雷达数据
4
一种双阶段神经声码器的语音合成方法、系统、终端及介质
卷积循环神经网络 声码器 阶段 语音 短时傅里叶变换
5
一种中韩双语语音识别与合成系统
引入注意力机制 门控循环单元 深度学习算法 梅尔频率倒谱系数 客观评估方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号