摘要
本发明提供一种适用于语音序列的多特征自适应选择融合方法,涉及语音分离技术领域。该方法涉及语音域对齐模块、自适应选择模块ASM和多特征融合模块FFM;语音域对齐模块在时间维度上利用输入特征X2对齐提取的输入特征X1,得到特征F0;自适应选择模块ASM通过自适应Map块对输入特征中每个通道的特征进行细化处理;通过选择Map块对细化后的特征中的每个时序信息进行选择;多特征融合模块将经过语音域对齐模块得到的F0与输入特征X2通过自适应选择模块ASM进行细化选择后进行融合,以丰富原始特征的表示能力。该方法能够有效融合两个时间维度不一致的特征向量,得到的融合特征能够进一步提高分离模型的分离精度和分离质量。
技术关键词
对齐模块
融合方法
语音
交互式特征
通道
冗余特征
融合特征
序列
交互特征
线性
时序
两阶段
语义
特征值
数据
级联
参数
分支
元素