摘要
本发明提出了一种基于元学习的个性化多说话人分离方法及系统,涉及音频处理技术领域,针对的问题是:现有技术无法满足小样本情况下目标说话人的个性化声音处理和定向语音分离,分离准确性差、效率低。该方法获取目标说话人注册音频和多个说话人混合音频;将目标说话人注册音频与预设噪声音频混合并输入至预训练好的说话人嵌入提取模型,得到目标说话人嵌入向量;构建语音分离网络模型,并采用元学习对所述语音分离网络模型进行训练,将所述目标说话人嵌入向量和所述多个说话人混合音频输入至已训练好的语音分离网络模型,得到目标语音信号。本发明实现了在小样本的情况下对目标说话人的定向语音分离,提高了分离准确性和分离效率。
技术关键词
音频特征
输出特征
时域卷积网络
加权特征
语音特征
注意力机制
模型训练模块
计算机装置
数据获取模块
解码器
噪声
处理器
样本
编码器
信号
系统为您推荐了相关专利信息
仿真培训方法
仿真培训系统
样本
医疗教学模型
液体
音乐特征
音乐数据处理方法
协方差特征
生成模型训练方法
生成音乐数据
汽车电池荷电状态
混合神经网络模型
车辆运行数据
电池荷电状态预测
特征提取模块