摘要
本申请实施例提供了一种语音处理方法、装置及介质。在具体执行该方法时,包括:针对包含背景噪声和混响语音信息的语音信息,首先采用多目标深度神经网络对语音信息进行降噪处理。然后对降噪处理后的语音信息进行去混响处理,得到纯净的语音信息。即本申请实施例通过两段式的方式,去除背景噪声和混响语音信息,相对于直接从含噪语音的频谱特征中直接映射出纯净语音的频谱特征的方式,能够显著改善显著获取的纯净语音信息的质量和可懂度,进而改善沟通效果,提升用户使用体验。
技术关键词
语音
深度神经网络
背景噪声信息
降噪单元
多层感知器
双向长短期记忆网络
频谱特征
监督式学习
计算机存储介质
存储计算机程序
训练集
功率
模块
元素
误差
参数
系统为您推荐了相关专利信息
智能空调
温度控制方法
温度控制策略
舒适度
储能电池
助手系统
大语言模型
文本识别
词嵌入模型
身份识别信息
负氧离子发生器
空气质量信息
量子点材料
机器学习模型
建立通信
语音识别模型
图像内容特征
图片
版画
计算机执行指令