一种基于深度学习的录播教室语音增强方法

正文

推荐专利

一种基于深度学习的录播教室语音增强方法

申请号：CN202411557781

申请日期：2024-11-04

公开号：CN119274566A

公开日期：2025-01-07

类型：发明专利

摘要

本发明公开了一种基于深度学习的录播教室语音增强方法，用于对录播教室内采集的语音信号进行增强处理，以提高录播教室音频清晰度和音频信息可懂度。本发明在传统的深度复卷积神经网络的基础上，提出了一种基于时频长短时记忆网络(F‑T‑LSTM)和混合注意力机制的改进网络结构模型。该模型在深度复卷积递归网络上进行改进，通过引入F‑T‑LSTM结构更加准确地描述语音时域和频域的相关性，并融合通道注意力机制和空间注意力机制形成混合注意力机制，对复数域的语音特征进行更加全面的特征提取，巧妙地将计算力集中于语谱图特征信息最为丰富的领域，从而显著提高复数域下语音增强网络的整体性能，该网络模型具有较好的泛化能力。

技术关键词

录播教室通道注意力机制卷积递归网络专业音频设备卷积神经网络结构语音特征解码器训练集数据深度学习算法参数语谱图编码器基础结构级联

系统为您推荐了相关专利信息

一种基于TransAUAV网络的多模态反无人机检测方法、系统、设备及介质

反无人机图像多模态注意力网络融合特征

实时语义分割视觉SLAM的方法和装置

SLAM系统语义分割网络动态场景相机位姿估计视觉

一种联动无线体温监测并自动调节温度设置的充气升温系统

无线体温监测柔性传感器控制平台多模态特征融合数据

一种运动心率获取方法、设备及可读存储介质

心率获取方法卡尔曼滤波信号神经网络模型心率获取设备

隧道支护钢格栅的检测方法、装置、电子设备及存储介质

隧道距离检测模块多尺度特征图片感兴趣

一种基于深度学习的录播教室语音增强方法

站点导航

APP 下载