摘要
本发明提供一种语音处理方法、装置、电子设备、存储介质及程序产品,涉及语音处理技术领域,其中方法包括:获取待处理的多语言混合语音数据;对所述多语言混合语音数据进行编码,得到语音嵌入表示;其中,所述语音嵌入表示与语言无关;将所述语音嵌入表示映射至同一语义空间,得到语义向量表示;基于所述语义向量表示进行语义理解,得到语义理解结果。本发明能够解决现有多语言混合语音数据的语义识别结果准确性和识别效率较差的问题。
技术关键词
语义向量
语音
多语言
局部特征提取
对齐模块
注意力
低资源语言
编码器
置信度阈值
非暂态计算机可读存储介质
系统性能退化
多尺度
数据
样本
融合特征
生成控制指令
生成对抗网络