语音识别方法、装置、电子设备、存储介质及产品

正文

推荐专利

申请号：CN202410984541

申请日期：2024-07-22

公开号：CN118782025A

公开日期：2024-10-15

类型：发明专利

摘要

本申请提出一种语音识别方法、装置、电子设备、存储介质及产品，该方法对待识别音频帧的音频帧特征进行编码，得到待识别音频帧的初始编码特征；通过语音识别模型的基于混合多专家编码器的编码网络层，对待识别音频帧的初始编码特征进行编码，得到待识别音频帧的目标编码特征；语音识别模型的参数是通过复用语音识别基模型的参数并进行训练后确定的，语音识别基模型的编码网络层包括单个编码器；基于待识别音频帧的目标编码特征，确定待识别音频帧对应的识别文本。本方案，语音识别模型的参数复用了语音识别基模型的参数，继承了语音识别基模型的语音识别能力，能减少训练和计算成本，在对训练和计算成本有限制时，能保证语音识别模型的性能。

技术关键词

语音识别模型编码特征音频编码器语音识别方法语音识别训练参数计算机程序指令文本样本编码模块语音识别装置处理器电子设备计算机程序产品存储器网络标识

系统为您推荐了相关专利信息

一种以文本驱动使图像和音频协同增强的多模态融合方法

音频特征提取语义向量图像特征提取文本网络

基于扩散模型的轴承故障诊断方法

轴承故障诊断方法模块频域特征代表故障轴承

直播内容审核方法、装置、计算设备及计算机存储介质

云端规则内容审核方法直播视频数据直播封面弹幕数据

医疗资产管理大数据分析方法及系统

大数据分析方法命名实体识别资产预训练语言模型资源分配

文件命名方法及其装置

关键词文件命名方法音频视频帧场景分类

语音识别方法、装置、电子设备、存储介质及产品

站点导航

APP 下载