一种基于非自回归方式的流式同步语音识别方法

正文

推荐专利

申请号：CN202410783195

申请日期：2024-06-18

公开号：CN118800225A

公开日期：2024-10-18

类型：发明专利

摘要

一种基于非自回归方式的流式同步语音识别方法，属于语音识别技术领域。具体包括以下步骤：1、将待训练的语音数据序列X输入至基于块注意力机制的编码器生成高维特征向量Z；2、将Z通过连接主义时间分类算法进行贪婪解码输出高维特征向量π；3、通过动态映射算法恢复语音信号块之间的块边界的错误输出4、将π输入至单词推理器获取语音中的单词间、字母间的联系输出高维特征向量π’；5、将π’中的标记随机选择并替换为特殊的＜mask＞标记后输入至语言模型解码器进行进一步解码的输出向量与连接主义时间分类算法输出的向量合并后生成最终的输出向量W。

技术关键词

语音识别方法高维特征向量注意力机制映射算法编码器标记语音识别方式字母解码器语音识别技术前馈神经网络矩阵索引动态序列分块

一种基于非自回归方式的流式同步语音识别方法

站点导航

APP 下载