一种基于元学习的个性化多说话人分离方法及系统

AITNT
正文
推荐专利
一种基于元学习的个性化多说话人分离方法及系统
申请号:CN202510692119
申请日期:2025-05-27
公开号:CN120564747A
公开日期:2025-08-29
类型:发明专利
摘要
本发明提出了一种基于元学习的个性化多说话人分离方法及系统,涉及音频处理技术领域,针对的问题是:现有技术无法满足小样本情况下目标说话人的个性化声音处理和定向语音分离,分离准确性差、效率低。该方法获取目标说话人注册音频和多个说话人混合音频;将目标说话人注册音频与预设噪声音频混合并输入至预训练好的说话人嵌入提取模型,得到目标说话人嵌入向量;构建语音分离网络模型,并采用元学习对所述语音分离网络模型进行训练,将所述目标说话人嵌入向量和所述多个说话人混合音频输入至已训练好的语音分离网络模型,得到目标语音信号。本发明实现了在小样本的情况下对目标说话人的定向语音分离,提高了分离准确性和分离效率。
技术关键词
音频特征 输出特征 时域卷积网络 加权特征 语音特征 注意力机制 模型训练模块 计算机装置 数据获取模块 解码器 噪声 处理器 样本 编码器 信号
系统为您推荐了相关专利信息
1
一种智能化腹膜透析出口仿真培训方法及系统
仿真培训方法 仿真培训系统 样本 医疗教学模型 液体
2
音乐数据处理方法、装置、电子设备及存储介质
音乐特征 音乐数据处理方法 协方差特征 生成模型训练方法 生成音乐数据
3
音唇同步检测方法和装置、电子设备、存储介质
模态特征 语音编码 音频特征 去噪模型 样本
4
一种汽车电池荷电状态预测方法及装置
汽车电池荷电状态 混合神经网络模型 车辆运行数据 电池荷电状态预测 特征提取模块
5
语音转换模型训练方法、语音转换方法、电子设备及存储介质
人声 编码器 波形 音素后验概率 语音转换方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号