摘要
本发明提供一种基于多配置分块上下文转换器模型的语音识别方法及装置,属于人工智能技术领域,该方法包括:获取待识别语音的特征序列;将特征序列输入至经过训练的语音识别模型,利用语音识别模型对待识别语音进行语音识别,得到语音识别模型输出的识别结果;语音识别模型为多配置分块上下文转换器MCC‑Transformer模型,MCC‑Transformer模型是在转换器模型的基础上,在编码器中引入一个语音MCC‑Transformer块构建而成,语音MCC‑Transformer块由多个MCC‑Transformer块堆叠而成。本发明在编码器中引入一个由多个MCC‑Transformer块堆叠而成的语音MCC‑Transformer块,提高了语音识别的准确率。
技术关键词
语音识别模型
语音识别方法
分块
转换器
注意力
解码器
机制
编码器
非暂态计算机可读存储介质
序列
文本
语音识别装置
级联
处理器
人工智能技术
计算机程序产品
识别模块
基础
系统为您推荐了相关专利信息
标签构建方法
样本
标签构建系统
药物虚拟筛选
冗余
图像分割模型
图像分割方法
黄铁矿
边界特征
补丁
多模态信息融合
解码器
深度相机
sigmoid函数
场景