语音识别及模型训练方法、装置、设备及计算机程序产品

正文

推荐专利

申请号：CN202510625610

申请日期：2025-05-15

公开号：CN120126459B

公开日期：2025-09-05

类型：发明专利

摘要

本申请公开了一种语音识别及模型训练方法、装置、设备及计算机程序产品，涉及语音识别技术领域，本申请对语音识别模型和文本重建模型联合训练，二者共享同一解码器，文本重建模型还包括基于大语言模型构建的文本编码器，能够对识别文本标签提取文本语义表征，计算音频编码器对音频样本提取的音频语义表征与文本语义表征间的特征对齐损失值，以及计算解码器输出的文本与识别文本标签间的文本识别损失值，大语言模型能够提取丰富的语义信息，通过特征对齐损失值可以将大语言模型丰富的语义信息迁移到音频编码器中，提升语音识别模型在特定领域下的识别效果。推理阶段，将待识别语音信号的声学特征输入语音识别模型，得到模型输出的语音识别结果。

技术关键词

语音识别模型音频编码器文本编码器语义大语言模型解码器文本识别语音识别方法声学特征更新模型参数识别语音信号采样模块标签对齐模块计算机程序产品模型训练方法

系统为您推荐了相关专利信息

人形机器人故障分析方法及相关设备

故障分析模型特征提取模型历史故障数据故障分析方法文本

基于多尺度特征融合的图像语义分割方法、装置及介质

图像语义分割网络多尺度特征融合图像语义分割方法融合特征解码器

一种要素抽取方法、装置、计算机设备及存储介质

要素抽取方法文本计算机可读指令扩展特征向量关键词

基于多层次特征与双重编码的候选回复语句评分方法及装置

语句特征提取模块多层次特征评分方法语义

一种智能BI取数方法、装置及可读存储介质

大语言模型参数意图识别指标深度神经网络

语音识别及模型训练方法、装置、设备及计算机程序产品

站点导航

APP 下载