一种语音识别方法及相关装置、设备和存储介质

正文

推荐专利

申请号：CN202411461438

申请日期：2024-10-18

公开号：CN119541495A

公开日期：2025-02-28

类型：发明专利

摘要

本申请公开了一种语音识别方法及相关装置、设备和存储介质，语音识别方法包括：获取当前轮次的第一解码特征；其中，当前轮次的第一解码特征包含上一轮次所输出解码字符的特征信息；获取待识别语音中各个语音帧的编码特征分别与第一解码特征之间的对齐概率，并基于对齐概率选择至少部分语音帧的编码特征与第一解码特征进行融合，得到第二解码特征；基于第二解码特征进行解码，得到当前轮次所输出的解码字符，并返回获取当前轮次的第一解码特征的步骤进行迭代，直至最新输出的解码字符表征语音识别结束为止，基于各个轮次的解码字符，得到待识别语音的识别文本。上述方案，能够提升语音识别的效率和准确性，特别是流式语音识别的效率和准确性。

技术关键词

语音识别模型编码特征样本解码网络语音识别方法多头注意力机制文本字符语音识别装置网络结构解码模块滑动窗口基准处理器输入端

系统为您推荐了相关专利信息

一种热蒸汽输送管路泄露风险健康监测方法及系统

蒸汽输送管路健康监测方法泄漏监测设备时间段频谱特征

一种跨尺寸水下推进器故障诊断方法

水下推进器故障诊断方法速度预测模型故障分类模型故障特征

一种地空电磁探测数据校正方法及系统

数据校正方法运动噪声 BP神经网络模型电磁平滑滤波方法

图像增强方法、装置、模型及其训练方法、电子设备

编码特征编码模块预训练网络图像增强模型层级

基于神经网络模型的语音克隆方法、装置、设备及介质

神经网络模型语音特征特征提取方式融合特征背景噪声

一种语音识别方法及相关装置、设备和存储介质

站点导航

APP 下载