基于并行Transformer的非自回归语音识别方法

正文

推荐专利

申请号：CN202411839796

申请日期：2024-12-13

公开号：CN119580711A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了一种基于并行Transformer的非自回归语音识别方法，包括：获取待识别语音信号，并将待识别语音信号输入编码器中；编码器采用自注意力机制提取待识别语音信号的隐藏表示，将隐藏表示输入预测器中；预测器基于连续整合发放机制动态预测目标序列长度并生成声学嵌入，将声学嵌入输入采样模块；采样模块通过目标嵌入与声学嵌入的混合生成语义嵌入，将语义嵌入输入解码器；解码器通过双向解码方式生成并行输出序列；对并行输出序列采用联合损失函数进行联合优化训练，得到语音识别结果。该方法显著提高了推理速度，实现了与自回归模型相当的识别精度，解决现有非自回归模型在目标序列预测精度和上下文建模能力上的不足。

技术关键词

识别语音信号采样模块联合损失函数语音识别方法语义输入解码器解码方式编码器信号输入模块语音识别模块注意力机制序列动态更新身份验证语音识别系统输入设备错误率处理器

系统为您推荐了相关专利信息

一种基于大数据的客户数据挖掘探索方法及系统

跨渠道客户指标条件依赖关系大数据

一种基于深度学习的生态环境修复评估方法

生态环境修复环境质量数据遥感图像数据时序生物多样性信息

儿童早期康复训练智能管理系统及方法

生理支持权重序列融合语义智能管理方法

多目标密集开放词汇图像记录

图像嵌入图像编码器文本编码器微调特征分类器

信息处理方法以及装置

语义信息处理方法信息处理装置模块

基于并行Transformer的非自回归语音识别方法

站点导航

APP 下载