摘要
本发明涉及语音识别技术领域,尤其涉及一种基于多尺度残差卷积和Longformer的语音识别方法,包括:S1、对预先获取的语音信号进行预处理得到相应的声学信号;S2、将所述声学信号输入至训练的语音识别模型,得到与所述语音信号对应的语音文本;其中,训练的语音识别模型是采用训练数据集对预先创建的语音识别模型进行训练得到的;所述训练数据集包括:多段第一声学信号以及分别与每一段第一声学信号一一对应的预先标注的语音文本;多段第一声学信号是由预先获取的用于训练的多段语音信号分别进行预处理得到的;所述语音识别模型是由多尺度残差卷积神经网络和longformer模型构建的。
技术关键词
语音识别模型
残差卷积神经网络
语音识别方法
多尺度
积层
信号
输出特征
分支
文本
语音识别技术
解码器
编码器
数据
基础
算法
参数
系统为您推荐了相关专利信息
多尺度
数据处理方法
频率
神经网络模型
图像识别模型
多源异构数据
底层融合特征
多模态特征
多层次特征提取
序列
融合深度神经网络
深度神经网络模型
评价方法
融合多尺度特征
热力图
电能监测数据
故障注入模块
数据分析模块
电化学阻抗谱
模拟电网故障
低压配电网故障
在线检测方法
线路零序电流
滑动窗口
GMM模型