摘要
本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标语音并提取其目标声学特征;然后将该目标声学特征输入至预先构建的语音识别模型,识别得到目标语音的语音热词识别结果;其中,语音识别模型包括音频编码器、热词编码器和解码器;解码器包括热词混合专家适配器和注意力机制网络。由于本申请是先基于适配器,利用样本语音数据及其对应的文本标注结果和样本热词文本,对端到端语音识别大模型进行训练生成了语音识别模型,不仅提高了模型训练效率并降低了训练成本,而且也有效提高了模型的识别准确度,这样,利用该语音识别模型对目标语音进行语音热词识别时,可以有效提高识别结果的效率和准确率。
技术关键词
语音识别模型
热词识别
声学特征
适配器
音频编码器
注意力机制
样本
解码器
语音识别方法
文本
感知线性预测
语音识别设备
语音识别装置
网络结构
可读存储介质
终端设备