一种基于深度学习的语音增强方法、装置、设备及介质

正文

推荐专利

申请号：CN202411933754

申请日期：2024-12-26

公开号：CN119811414A

公开日期：2025-04-11

类型：发明专利

摘要

本发明涉及语音识别技术领域，公开了一种基于深度学习的语音增强方法、装置、设备及介质。该方法包括：获取带噪语音信号，通过一维卷积对带噪语音信号进行特征提取，得到带噪语音特征；将带噪语音特征输入掩膜预测模型，得到比值掩膜，根据比值掩膜计算预测纯净语音特征；将预测纯净语音特征输入全连接层，得到预测纯净语音信号；获取实际纯净语音信号，根据实际纯净语音信号与预测纯净语音信号，训练一维卷积、掩膜预测模型与全连接层，得到训练后的一维卷积、训练后的掩膜预测模型与训练后的全连接层。本申请可以适应不同采样率的语音增强，避免了人为特征提取难以兼容不同采样率的问题。

技术关键词

带噪语音信号语音特征掩膜语音识别技术采样率可读存储介质误差传播算法处理器网络结构计算机设备模块存储器信噪比指标元素

系统为您推荐了相关专利信息

一种高亮Micro-LED芯片及其制作方法

半导体层接触电极高温淬火工艺控制表面粗糙度蓝宝石衬底

一种基于低采样率信号云端智能重构的液压泵远程状态监测方法及系统

远程状态监测方法采样率液压泵深层特征提取状态监测数据

一种基于人工智能的数字人平台交互系统及方法

答案面部特征数字孪生技术交互方法交互系统

一种语音生成方法及装置

语音生成方法语音特征参数语音生成模型文本样本

一种基于深度语音嵌入的声纹识别方法及系统

声纹识别方法高维特征向量深度学习网络模型预训练模型大规模语音数据

一种基于深度学习的语音增强方法、装置、设备及介质

站点导航

APP 下载