摘要
本申请实施例公开了一种基于生成对抗网络模型的语音增强方法、装置及电子设备,可解决如何更准确有效的降低噪音影响,提升音频信号的清晰度和质量的问题。该方法包括:获取待处理语音数据;通过生成对抗网络模型中的目标生成器,对待处理语音数据进行卷积处理,得到初始语音数据,目标生成器包括扩张卷积层和标准卷积层,目标生成器是通过对抗损失函数、感知损失函数和重构损失函数共同训练得到的;通过生成对抗网络模型中的目标判别器,对初始语音数据和待处理语音数据进行判别,得到目标判别结果,目标判别器包括时域判别器和频域判别器;当检测到目标判别结果满足预设要求时,确定初始语音数据为待处理语音数据经过语音增强后的语音数据。
技术关键词
生成对抗网络模型
语音
感知损失函数
数据
可执行程序代码
重构
音频
电子设备
可读存储介质
计算机
存储器
处理器
模块
指令
指标
信号
系统为您推荐了相关专利信息
并行FIR滤波器
分布式算法
高速数字信号处理
滤波器系数
多路并行数据
业务需求分析方法
关键词
语音
可读存储介质
模板
BiLSTM模型
非线性映射关系
新能源机组
坐标系
Simulink软件
知识图谱系统
动态知识图谱
多模态特征
数据处理方法
编码模块