一种流式语音识别方法

AITNT
正文
推荐专利
一种流式语音识别方法
申请号:CN202510284301
申请日期:2025-03-11
公开号:CN120199234A
公开日期:2025-06-24
类型:发明专利
摘要
本发明提供了一种流式语音识别方法,包括如下步骤:S1、收集音频数据集;S2、对预处理后的音频数据集中的数据进行特征提取,得到音频特征;S3、将音频特征输入至训练后的编码器中进行编码,输出经过编码和归一化的特征表示;S4、将经过编码和归一化的特征表示馈送到训练后的CIF模块中,CIF模块使用一维卷积层生成权重,同时使用Dropout和sigmoid激活函数,输出整合完声学特征;S5、将整合完声学特征馈送至训练后的解码器进行解码,得到预测概率。本发明提出基于神经元整合发射机制的改进Conformer流式语音识别方法,提高识别准确性。
技术关键词
流式语音识别方法 编码器 声学特征 音频特征 解码器 代表 注意力机制 高维特征向量 短时傅里叶变换 字符 音频块 预测类别 序列特征 滤波器 数据 卷积模块
系统为您推荐了相关专利信息
1
一种基于潜在一致性模型的无需微调高效拖拽式编辑方法
编辑方法 噪声预测 文本编码器 界面 低噪声
2
一种面向机坪管制的空管指令识别与航空器行为预警方法
航空器 预警方法 指令 语义特征 路段
3
图像去雾方法、装置、电子设备和存储介质
预训练模型 可见光图像 图像去雾方法 去雾模型 图像去雾装置
4
基于图像处理的人脸门禁识别系统、方法及存储介质
人脸门禁识别方法 人脸特征 人脸识别模型 人脸门禁识别系统 图像处理
5
一种不依赖分割标签的多模态医学图像配准方法
医学图像配准方法 多模态医学影像 标签 关键点 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号