一种语种识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510630973

申请日期：2025-05-16

公开号：CN120356456A

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供了一种语种识别方法、装置、电子设备及存储介质，所述语种识别方法包括：获取待识别音频；将待识别音频输入至语种识别模型之中进行音频特征提取，对所述音频特征进行语种编码处理和音素编码处理生成音频段级别的音位嵌入向量序列，对所述音位嵌入向量序列进行特征编码处理、句子级别统计处理以及线性投影处理，输出所述待识别音频的语种类别；其中，所述语种识别模型是通过对神经网络模型进行自监督音素分割任务以及语种识别任务联合训练得到的。通过音素分割任务和语种识别任务的联合训练得到的语种识别模型，有效提高了音频的语种识别的准确性。

技术关键词

语种识别方法神经网络模型音频特征提取样本序列机器可读指令线性识别模块电子设备多头注意力机制处理器可读存储介质编码器输出特征存储器

系统为您推荐了相关专利信息

一种基于自监督条件自编码器的非侵入式负荷检测方法

负荷检测方法轨迹特征重构图像预训练模型

一种屏幕外观缺陷的非线性智能评价方法

智能评价方法非线性多层感知网络样本多维特征向量

激光切割机光束稳定与传输优化方法及平台

传输优化方法激光切割机光束工件 PID控制器

前端页面异常检测方法、装置、电子设备及介质

页面异常检测方法元素页面数据视觉保护用户隐私

信息处理方法、系统、电子设备、存储介质及程序产品

关键词信息处理方法标识人工智能内容模板

一种语种识别方法、装置、电子设备及存储介质

站点导航

APP 下载