基于特征差异集成的非自回归语音识别方法

正文

推荐专利

基于特征差异集成的非自回归语音识别方法

申请号：CN202411967406

申请日期：2024-12-30

公开号：CN119811373A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了基于特征差异集成的非自回归语音识别方法，包括：步骤1，收集音频数据转为wav格式并标注，划分为训练集、验证集和测试集；步骤2，对数据集中音频文件进行预处理操作；步骤3，统计训练集中的文本数据，通过统计词频、排序、去重后形成token列表；步骤4，构建语音识别模型FDI；步骤5，使用训练集对步骤4构建的FDI模型进行训练，使用验证集评估模型的性能变化，得到语音识别模型；步骤6，使用测试集评估模型的性能。本发明更直观的从音频数据中学习音频和文字的对齐，并减少了环境噪音、停顿等情况下对语音识别的影响。

技术关键词

语音识别方法构建语音识别模型音频编码器数据语音识别准确率频谱特征多头注意力机制解码器文本列表训练集声学特征标记标签

基于特征差异集成的非自回归语音识别方法

站点导航

APP 下载