语音识别方法、装置、电子设备以及存储介质

正文

推荐专利

申请号：CN202411576253

申请日期：2024-11-06

公开号：CN119600995A

公开日期：2025-03-11

类型：发明专利

摘要

本公开提供了一种语音识别方法、装置、电子设备以及存储介质，涉及语音识别技术领域，该方法包括：获取至少一个样本语音和样本语音对应的标准语音文本；对样本语音进行语音特征提取，得到样本语音特征；将样本语音特征输入训练完成的声学模型，得到训练完成的声学模型输出的声学建模特征；将声学建模特征和标准语音文本输入大语言模型，得到大语言模型输出的预测概率分布和预测语音文本，预测概率分布用于指示样本语音对应预测词语的概率分布；基于预测概率分布、预测语音文本和标准语音文本，训练大语言模型，以使训练完成的大语言模型和训练完成的声学模型具备语音识别功能。该方法可以提高语音识别准确率。

技术关键词

大语言模型文本语音特征提取语音识别方法样本语音识别功能语音识别准确率词语语音识别装置语音识别技术语音识别模块电子设备字预测特征提取模块计算机网络标签处理器

系统为您推荐了相关专利信息

一种基于RPA的数字化办公方法、装置、设备及介质

办公方法分割图像数据序列表达式校验终端

脊柱疾病诊断用多模态大语言模型的评测方法及系统

大语言模型评测方法基准多模态定位问题

电力设备视觉大模型构建、训练、评估方法及系统

电力巡检图像样本输出特征生成电力双分支结构

三维运动检索方法、装置、电子设备及存储介质

运动检索方法文本运动特征旋转特征样本

一种智能体驱动的三维视频生成的方法和系统

控制智能体动态场景三维视频生成方法处理单元三维运动参数

语音识别方法、装置、电子设备以及存储介质

站点导航

APP 下载