摘要
本发明公开了一种基于并行Transformer的非自回归语音识别方法,包括:获取待识别语音信号,并将待识别语音信号输入编码器中;编码器采用自注意力机制提取待识别语音信号的隐藏表示,将隐藏表示输入预测器中;预测器基于连续整合发放机制动态预测目标序列长度并生成声学嵌入,将声学嵌入输入采样模块;采样模块通过目标嵌入与声学嵌入的混合生成语义嵌入,将语义嵌入输入解码器;解码器通过双向解码方式生成并行输出序列;对并行输出序列采用联合损失函数进行联合优化训练,得到语音识别结果。该方法显著提高了推理速度,实现了与自回归模型相当的识别精度,解决现有非自回归模型在目标序列预测精度和上下文建模能力上的不足。
技术关键词
识别语音信号
采样模块
联合损失函数
语音识别方法
语义
输入解码器
解码方式
编码器
信号输入模块
语音识别模块
注意力机制
序列
动态更新
身份验证
语音识别系统
输入设备
错误率
处理器
系统为您推荐了相关专利信息
生态环境修复
环境质量数据
遥感图像数据
时序
生物多样性信息
图像嵌入
图像编码器
文本编码器
微调特征
分类器