基于多尺度残差卷积和Longformer的语音识别方法

正文

推荐专利

申请号：CN202411612729

申请日期：2024-11-13

公开号：CN119541460A

公开日期：2025-02-28

类型：发明专利

摘要

本发明涉及语音识别技术领域，尤其涉及一种基于多尺度残差卷积和Longformer的语音识别方法，包括：S1、对预先获取的语音信号进行预处理得到相应的声学信号；S2、将所述声学信号输入至训练的语音识别模型，得到与所述语音信号对应的语音文本；其中，训练的语音识别模型是采用训练数据集对预先创建的语音识别模型进行训练得到的；所述训练数据集包括：多段第一声学信号以及分别与每一段第一声学信号一一对应的预先标注的语音文本；多段第一声学信号是由预先获取的用于训练的多段语音信号分别进行预处理得到的；所述语音识别模型是由多尺度残差卷积神经网络和longformer模型构建的。

技术关键词

语音识别模型残差卷积神经网络语音识别方法多尺度积层信号输出特征分支文本语音识别技术解码器编码器数据基础算法参数

系统为您推荐了相关专利信息

多尺度数据处理方法、装置、设备、存储介质及程序产品

多尺度数据处理方法频率神经网络模型图像识别模型

用于多源异构数据的多粒度提取与增强方法、装置及设备

多源异构数据底层融合特征多模态特征多层次特征提取序列

一种基于多层激活响应融合深度神经网络的器官超声图像质量评价方法及系统

融合深度神经网络深度神经网络模型评价方法融合多尺度特征热力图

一种储能测试系统及方法

电能监测数据故障注入模块数据分析模块电化学阻抗谱模拟电网故障

一种基于交叉小波相干分析的中低压配电网故障在线检测方法

低压配电网故障在线检测方法线路零序电流滑动窗口 GMM模型

基于多尺度残差卷积和Longformer的语音识别方法

站点导航

APP 下载