摘要
本申请公开了一种语音识别方法、装置、相关设备及计算机程序产品,本申请所采用的语音识别模型包括共享编码器、支持流式解码处理的第一类解码器和支持非流式解码处理的第二类解码器,共享编码器采用同时支持流式和非流式识别任务的编码网络。待识别语音可以是流式识别任务中由音频块组成的语音数据流,也可以是非流式识别任务中的整段语音,由共享编码器对待识别语音的声学特征进行编码,编码特征送入目标解码器进行解码,基于解码结果得到最终语音识别结果。流式识别任务中目标解码器为第一类解码器,非流式识别任务中目标解码器为第二类解码器。本申请通过统一的语音识别模型,可以适应于流式识别任务及非流式识别任务,提高了使用的便捷性。
技术关键词
解码器
编码特征
语音识别模型
语音识别方法
声学特征
编码器
计算机程序产品
语音识别装置
特征提取单元
多任务
语种识别
音频块
处理器
注意力机制
可读存储介质
网络
系统为您推荐了相关专利信息
智能问答系统
网络模块
转换器
预训练模型
转换编码器
图像编码器
图像实例分割方法
解码器
实例分割模型
蒸馏方法