一种流式语音识别方法

正文

推荐专利

一种流式语音识别方法

申请号：CN202510284301

申请日期：2025-03-11

公开号：CN120199234A

公开日期：2025-06-24

类型：发明专利

摘要

本发明提供了一种流式语音识别方法，包括如下步骤：S1、收集音频数据集；S2、对预处理后的音频数据集中的数据进行特征提取，得到音频特征；S3、将音频特征输入至训练后的编码器中进行编码，输出经过编码和归一化的特征表示；S4、将经过编码和归一化的特征表示馈送到训练后的CIF模块中，CIF模块使用一维卷积层生成权重，同时使用Dropout和sigmoid激活函数，输出整合完声学特征；S5、将整合完声学特征馈送至训练后的解码器进行解码，得到预测概率。本发明提出基于神经元整合发射机制的改进Conformer流式语音识别方法，提高识别准确性。

技术关键词

流式语音识别方法编码器声学特征音频特征解码器代表注意力机制高维特征向量短时傅里叶变换字符音频块预测类别序列特征滤波器数据卷积模块

系统为您推荐了相关专利信息

一种基于潜在一致性模型的无需微调高效拖拽式编辑方法

编辑方法噪声预测文本编码器界面低噪声

一种面向机坪管制的空管指令识别与航空器行为预警方法

航空器预警方法指令语义特征路段

图像去雾方法、装置、电子设备和存储介质

预训练模型可见光图像图像去雾方法去雾模型图像去雾装置

基于图像处理的人脸门禁识别系统、方法及存储介质

人脸门禁识别方法人脸特征人脸识别模型人脸门禁识别系统图像处理

一种不依赖分割标签的多模态医学图像配准方法

医学图像配准方法多模态医学影像标签关键点编码器

一种流式语音识别方法

站点导航

APP 下载