一种用于语音分离和目标语音提取的通用模型

AITNT
正文
推荐专利
一种用于语音分离和目标语音提取的通用模型
申请号:CN202510694233
申请日期:2025-05-27
公开号:CN120544592A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种用于语音分离和目标语音提取的通用模型,涉及语音领域,包括分离网络、EDA模块和线索网络三个部分;所述分离网络基于频带划分递归神经网络,即BSRNN,是一种频域分离网络;将所述EDA模块引入频域语音分离模型BSRNN,使其具备处理未知、可变说话人数量的混杂语音的能力;使用RawNet3作为所述线索网络,实现目标语音提取的功能。本模型能根据输入的不同在不同的任务间灵活切换,实现“通用”的效果,使模型的灵活性和泛用性大大提高,进而也避免了针对不同任务使用不同模型带来的额外开销,降低了成本。
技术关键词
语音 线索 递归神经网络 模块 傅里叶变换处理 序列 短时傅里叶变换 长短期记忆网络 多层感知机 解码器 编码器 线性 分阶段 信噪比 索引 分支 信号 策略
系统为您推荐了相关专利信息
1
一种基于改进狼群算法优化神经网络的智能网联车辆协同定位
狼群算法 智能网联车辆 优化神经网络 协同定位方法 优化BP神经网络
2
一种地下管廊室分场景下的UWB融合定位方法及装置
融合定位方法 信道脉冲响应 双边双向测距算法 分布式天线 室分系统
3
一种应用于文本模态缺失场景下的多模态情感识别方法和系统
关键帧 情感识别模型 情感识别方法 注意力 跨模态
4
一种烹饪区域可调的控制方法及系统
微单元 区域可调 接触面 锅具 加热单元
5
基于视频的异常行为检测方法和装置、设备及存储介质
预测特征 音频特征提取 样本 视频特征提取 分类子模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号