摘要
本申请提供了一种基于判别‑生成联合模型的语音增强方法,包括获取待处理语音信号,其中,待处理语音信号表征带有噪音的语音信号;将待处理语音信号输入至判别‑生成联合模型,得到预测频域信息和预测分数函数,其中,判别‑生成联合模型包括语音判别网络、语音交互网络和语音生成网络,语音交互网络用于对语音判别网络和语音生成网络中的隐特征进行融合以使得语音生成网络根据融合隐特征生成预测分数函数;根据预测频域信息和预测分数函数,生成增强语音信号。
技术关键词
生成联合模型
语音
交互网络
融合卷积特征
判别特征
输出特征
生成特征
线性
双向长短期记忆网络
嵌入特征
解码器
标签
编码器
多头注意力机制
融合特征
数据