一种基于元学习的个性化多说话人分离方法及系统

正文

推荐专利

申请号：CN202510692119

申请日期：2025-05-27

公开号：CN120564747A

公开日期：2025-08-29

类型：发明专利

摘要

本发明提出了一种基于元学习的个性化多说话人分离方法及系统，涉及音频处理技术领域，针对的问题是：现有技术无法满足小样本情况下目标说话人的个性化声音处理和定向语音分离，分离准确性差、效率低。该方法获取目标说话人注册音频和多个说话人混合音频；将目标说话人注册音频与预设噪声音频混合并输入至预训练好的说话人嵌入提取模型，得到目标说话人嵌入向量；构建语音分离网络模型，并采用元学习对所述语音分离网络模型进行训练，将所述目标说话人嵌入向量和所述多个说话人混合音频输入至已训练好的语音分离网络模型，得到目标语音信号。本发明实现了在小样本的情况下对目标说话人的定向语音分离，提高了分离准确性和分离效率。

技术关键词

音频特征输出特征时域卷积网络加权特征语音特征注意力机制模型训练模块计算机装置数据获取模块解码器噪声处理器样本编码器信号

系统为您推荐了相关专利信息

一种智能化腹膜透析出口仿真培训方法及系统

仿真培训方法仿真培训系统样本医疗教学模型液体

音乐数据处理方法、装置、电子设备及存储介质

音乐特征音乐数据处理方法协方差特征生成模型训练方法生成音乐数据

音唇同步检测方法和装置、电子设备、存储介质

模态特征语音编码音频特征去噪模型样本

一种汽车电池荷电状态预测方法及装置

汽车电池荷电状态混合神经网络模型车辆运行数据电池荷电状态预测特征提取模块

语音转换模型训练方法、语音转换方法、电子设备及存储介质

人声编码器波形音素后验概率语音转换方法

一种基于元学习的个性化多说话人分离方法及系统

站点导航

APP 下载