一种用于语音分离和目标语音提取的通用模型

正文

推荐专利

申请号：CN202510694233

申请日期：2025-05-27

公开号：CN120544592A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了一种用于语音分离和目标语音提取的通用模型，涉及语音领域，包括分离网络、EDA模块和线索网络三个部分；所述分离网络基于频带划分递归神经网络，即BSRNN，是一种频域分离网络；将所述EDA模块引入频域语音分离模型BSRNN，使其具备处理未知、可变说话人数量的混杂语音的能力；使用RawNet3作为所述线索网络，实现目标语音提取的功能。本模型能根据输入的不同在不同的任务间灵活切换，实现“通用”的效果，使模型的灵活性和泛用性大大提高，进而也避免了针对不同任务使用不同模型带来的额外开销，降低了成本。

技术关键词

语音线索递归神经网络模块傅里叶变换处理序列短时傅里叶变换长短期记忆网络多层感知机解码器编码器线性分阶段信噪比索引分支信号策略

系统为您推荐了相关专利信息

一种基于改进狼群算法优化神经网络的智能网联车辆协同定位

狼群算法智能网联车辆优化神经网络协同定位方法优化BP神经网络

一种地下管廊室分场景下的UWB融合定位方法及装置

融合定位方法信道脉冲响应双边双向测距算法分布式天线室分系统

一种应用于文本模态缺失场景下的多模态情感识别方法和系统

关键帧情感识别模型情感识别方法注意力跨模态

一种烹饪区域可调的控制方法及系统

微单元区域可调接触面锅具加热单元

基于视频的异常行为检测方法和装置、设备及存储介质

预测特征音频特征提取样本视频特征提取分类子模型

一种用于语音分离和目标语音提取的通用模型

站点导航

APP 下载