摘要
本发明涉及语音识别技术领域,尤其涉及一种基于大核卷积和线性自注意力的语音识别方法,包括:对预先获取的语音信号进行预处理得到相应的声学信号;将声学信号输入至训练的LKCovLFormer模型,得到语音文本;训练的LKCovLFormer模型是采用训练数据集对LKCovLFormer模型进行训练得到的;训练数据集包括:多段第一声学信号以及分别与每一段第一声学信号一一对应的语音文本;LKCovLFormer模型包括N层循环堆叠模块;每一层循环堆叠模块均包括依次排列的第一前馈模块、第一残差模块、线性自注意力模块、第二残差模块、大核卷积模块、第三残差模块、第二前馈模块、第四残差模块、层标准化模块。
技术关键词
堆叠模块
语音识别方法
残差模块
局部空间特征
线性
卷积模块
融合特征
依赖特征
信号
注意力机制
语音识别模型
数据
文本
语音识别技术
矩阵
通道
参数
系统为您推荐了相关专利信息
深度残差神经网络
航迹数据
特征提取网络
隐性特征
分类网络
网络节点模型
运维
资源优化配置
资源配置优化方法
节点资源状态
系统建立方法
二进制伪随机序列
序列扩频通信
Chen混沌系统
系统抗干扰能力