音频编码器训练方法、语音识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510398626

申请日期：2025-03-31

公开号：CN120452425A

公开日期：2025-08-08

类型：发明专利

摘要

本公开提供了一种音频编码器训练方法、语音识别方法、装置、电子设备及存储介质，涉及智能座舱技术领域中的AI或人工智能技术。该方法包括：将训练数据分别输入第一训练模型和第二训练模型；第一训练模型和第二训练模型具有关联关系；训练数据中包括：音频数据和文本数据；通过第一训练模型对训练数据进行特征提取，得到第一特征表示；通过第二训练模型对训练数据进行特征提取，得到第二特征表示；根据对应的第一特征表示和第二特征表示，确定第一损失；根据第一损失对第二训练模型进行训练；响应于第二训练模型训练收敛，基于第二训练模型构建音频编码器。本公开扩展了训练数据范围，将文本数据引入训练，能够学习到更丰富的语言特征。

技术关键词

音频编码器词嵌入向量语音识别方法文本音频特征提取非临时性计算机可读存储介质大语言模型智能座舱技术参数序列语音识别装置数据输入模块语音识别模块模型训练模块电子设备移动终端分词

音频编码器训练方法、语音识别方法、装置、电子设备及存储介质

站点导航

APP 下载