一种基于大核卷积和线性自注意力的语音识别方法

正文

推荐专利

申请号：CN202411643141

申请日期：2024-11-18

公开号：CN119541471A

公开日期：2025-02-28

类型：发明专利

摘要

本发明涉及语音识别技术领域，尤其涉及一种基于大核卷积和线性自注意力的语音识别方法，包括：对预先获取的语音信号进行预处理得到相应的声学信号；将声学信号输入至训练的LKCovLFormer模型，得到语音文本；训练的LKCovLFormer模型是采用训练数据集对LKCovLFormer模型进行训练得到的；训练数据集包括：多段第一声学信号以及分别与每一段第一声学信号一一对应的语音文本；LKCovLFormer模型包括N层循环堆叠模块；每一层循环堆叠模块均包括依次排列的第一前馈模块、第一残差模块、线性自注意力模块、第二残差模块、大核卷积模块、第三残差模块、第二前馈模块、第四残差模块、层标准化模块。

技术关键词

堆叠模块语音识别方法残差模块局部空间特征线性卷积模块融合特征依赖特征信号注意力机制语音识别模型数据文本语音识别技术矩阵通道参数

系统为您推荐了相关专利信息

基于深度残差神经网络的航迹识别方法

深度残差神经网络航迹数据特征提取网络隐性特征分类网络

一种梯级调控运行数据分析建模系统

建模系统梯级构建预测模型调控策略非线性

一种智能感应式近红外振动正畸加速器

子模块红外照射感应式传感器模块正畸治疗

一种ITSS运维资源配置优化方法及系统

网络节点模型运维资源优化配置资源配置优化方法节点资源状态

一种抗估计的Lorenz混沌衍生系统建立方法

系统建立方法二进制伪随机序列序列扩频通信 Chen混沌系统系统抗干扰能力

一种基于大核卷积和线性自注意力的语音识别方法

站点导航

APP 下载