摘要
本发明提供了一种流式语音识别方法,包括如下步骤:S1、收集音频数据集;S2、对预处理后的音频数据集中的数据进行特征提取,得到音频特征;S3、将音频特征输入至训练后的编码器中进行编码,输出经过编码和归一化的特征表示;S4、将经过编码和归一化的特征表示馈送到训练后的CIF模块中,CIF模块使用一维卷积层生成权重,同时使用Dropout和sigmoid激活函数,输出整合完声学特征;S5、将整合完声学特征馈送至训练后的解码器进行解码,得到预测概率。本发明提出基于神经元整合发射机制的改进Conformer流式语音识别方法,提高识别准确性。
技术关键词
流式语音识别方法
编码器
声学特征
音频特征
解码器
代表
注意力机制
高维特征向量
短时傅里叶变换
字符
音频块
预测类别
序列特征
滤波器
数据
卷积模块
系统为您推荐了相关专利信息
预训练模型
可见光图像
图像去雾方法
去雾模型
图像去雾装置
人脸门禁识别方法
人脸特征
人脸识别模型
人脸门禁识别系统
图像处理
医学图像配准方法
多模态医学影像
标签
关键点
编码器