基于并行Transformer的非自回归语音识别方法

AITNT
正文
推荐专利
基于并行Transformer的非自回归语音识别方法
申请号:CN202411839796
申请日期:2024-12-13
公开号:CN119580711A
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了一种基于并行Transformer的非自回归语音识别方法,包括:获取待识别语音信号,并将待识别语音信号输入编码器中;编码器采用自注意力机制提取待识别语音信号的隐藏表示,将隐藏表示输入预测器中;预测器基于连续整合发放机制动态预测目标序列长度并生成声学嵌入,将声学嵌入输入采样模块;采样模块通过目标嵌入与声学嵌入的混合生成语义嵌入,将语义嵌入输入解码器;解码器通过双向解码方式生成并行输出序列;对并行输出序列采用联合损失函数进行联合优化训练,得到语音识别结果。该方法显著提高了推理速度,实现了与自回归模型相当的识别精度,解决现有非自回归模型在目标序列预测精度和上下文建模能力上的不足。
技术关键词
识别语音信号 采样模块 联合损失函数 语音识别方法 语义 输入解码器 解码方式 编码器 信号输入模块 语音识别模块 注意力机制 序列 动态更新 身份验证 语音识别系统 输入设备 错误率 处理器
系统为您推荐了相关专利信息
1
一种基于大数据的客户数据挖掘探索方法及系统
跨渠道 客户 指标 条件依赖关系 大数据
2
一种基于深度学习的生态环境修复评估方法
生态环境修复 环境质量数据 遥感图像数据 时序 生物多样性信息
3
儿童早期康复训练智能管理系统及方法
生理 支持权重 序列 融合语义 智能管理方法
4
多目标密集开放词汇图像记录
图像嵌入 图像编码器 文本编码器 微调特征 分类器
5
信息处理方法以及装置
语义 信息处理方法 信息处理装置 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号