摘要
本发明提供了一种结合文本纠错的流式语音识别方法。该方法包括:将待识别的音频数据进行分块处理后,将各个块的音频数据输入到流式语音识别系统,流式语音识别系统输出各个块的识别文本;将各个块的识别文本划分为等长文本块,再输入到纠错模型;纠错模型通过编码模块输出各个块的编码表示,再通过解码模块将各个块的编码表示逐块进行解码,利用记忆库计算当前帧与历史帧的相关性,输出纠错处理后的各个块;将纠错处理后的各个块发送至边缘补偿模块,边缘补偿模块利用历史块共同解码结果对各个块的右边缘进行修正补偿,得到各个块的音频数据的最终的识别文本。本发明方法实现了纠错模型的流式输出,使用边缘补偿机制解决了边缘错误纠正的问题。
技术关键词
语音识别系统
流式语音识别方法
文本
序列
错误检测器
音频
字符
解码模块
编码模块
二维卷积神经网络
编解码器架构
纠错模块
声学特征
记忆
注意力
分块
编码器
自动语音识别
系统为您推荐了相关专利信息
缺陷识别方法
变电站
视觉特征
多模态
注意力机制