摘要
本发明涉及语音识别技术领域,公开了一种基于深度学习的语音增强方法、装置、设备及介质。该方法包括:获取带噪语音信号,通过一维卷积对带噪语音信号进行特征提取,得到带噪语音特征;将带噪语音特征输入掩膜预测模型,得到比值掩膜,根据比值掩膜计算预测纯净语音特征;将预测纯净语音特征输入全连接层,得到预测纯净语音信号;获取实际纯净语音信号,根据实际纯净语音信号与预测纯净语音信号,训练一维卷积、掩膜预测模型与全连接层,得到训练后的一维卷积、训练后的掩膜预测模型与训练后的全连接层。本申请可以适应不同采样率的语音增强,避免了人为特征提取难以兼容不同采样率的问题。
技术关键词
带噪语音信号
语音特征
掩膜
语音识别技术
采样率
可读存储介质
误差
传播算法
处理器
网络结构
计算机设备
模块
存储器
信噪比
指标
元素
系统为您推荐了相关专利信息
半导体层
接触电极
高温淬火工艺
控制表面粗糙度
蓝宝石衬底
远程状态监测方法
采样率
液压泵
深层特征提取
状态监测数据
语音生成方法
语音特征参数
语音生成模型
文本
样本
声纹识别方法
高维特征向量
深度学习网络模型
预训练模型
大规模语音数据