摘要
本申请提出一种语音识别方法、装置、电子设备、存储介质及产品,该方法对待识别音频帧的音频帧特征进行编码,得到待识别音频帧的初始编码特征;通过语音识别模型的基于混合多专家编码器的编码网络层,对待识别音频帧的初始编码特征进行编码,得到待识别音频帧的目标编码特征;语音识别模型的参数是通过复用语音识别基模型的参数并进行训练后确定的,语音识别基模型的编码网络层包括单个编码器;基于待识别音频帧的目标编码特征,确定待识别音频帧对应的识别文本。本方案,语音识别模型的参数复用了语音识别基模型的参数,继承了语音识别基模型的语音识别能力,能减少训练和计算成本,在对训练和计算成本有限制时,能保证语音识别模型的性能。
技术关键词
语音识别模型
编码特征
音频
编码器
语音识别方法
语音识别训练
参数
计算机程序指令
文本
样本
编码模块
语音识别装置
处理器
电子设备
计算机程序产品
存储器
网络
标识
系统为您推荐了相关专利信息
云端规则
内容审核方法
直播视频数据
直播封面
弹幕数据
大数据分析方法
命名实体识别
资产
预训练语言模型
资源分配