摘要
本发明公开了一种用于语音分离和目标语音提取的通用模型,涉及语音领域,包括分离网络、EDA模块和线索网络三个部分;所述分离网络基于频带划分递归神经网络,即BSRNN,是一种频域分离网络;将所述EDA模块引入频域语音分离模型BSRNN,使其具备处理未知、可变说话人数量的混杂语音的能力;使用RawNet3作为所述线索网络,实现目标语音提取的功能。本模型能根据输入的不同在不同的任务间灵活切换,实现“通用”的效果,使模型的灵活性和泛用性大大提高,进而也避免了针对不同任务使用不同模型带来的额外开销,降低了成本。
技术关键词
语音
线索
递归神经网络
模块
傅里叶变换处理
序列
短时傅里叶变换
长短期记忆网络
多层感知机
解码器
编码器
线性
分阶段
信噪比
索引
分支
信号
策略
系统为您推荐了相关专利信息
狼群算法
智能网联车辆
优化神经网络
协同定位方法
优化BP神经网络
融合定位方法
信道脉冲响应
双边双向测距算法
分布式天线
室分系统
关键帧
情感识别模型
情感识别方法
注意力
跨模态
预测特征
音频特征提取
样本
视频特征提取
分类子模型