一种基于大核卷积和线性自注意力的语音识别方法

AITNT
正文
推荐专利
一种基于大核卷积和线性自注意力的语音识别方法
申请号:CN202411643141
申请日期:2024-11-18
公开号:CN119541471A
公开日期:2025-02-28
类型:发明专利
摘要
本发明涉及语音识别技术领域,尤其涉及一种基于大核卷积和线性自注意力的语音识别方法,包括:对预先获取的语音信号进行预处理得到相应的声学信号;将声学信号输入至训练的LKCovLFormer模型,得到语音文本;训练的LKCovLFormer模型是采用训练数据集对LKCovLFormer模型进行训练得到的;训练数据集包括:多段第一声学信号以及分别与每一段第一声学信号一一对应的语音文本;LKCovLFormer模型包括N层循环堆叠模块;每一层循环堆叠模块均包括依次排列的第一前馈模块、第一残差模块、线性自注意力模块、第二残差模块、大核卷积模块、第三残差模块、第二前馈模块、第四残差模块、层标准化模块。
技术关键词
堆叠模块 语音识别方法 残差模块 局部空间特征 线性 卷积模块 融合特征 依赖特征 信号 注意力机制 语音识别模型 数据 文本 语音识别技术 矩阵 通道 参数
系统为您推荐了相关专利信息
1
基于深度残差神经网络的航迹识别方法
深度残差神经网络 航迹数据 特征提取网络 隐性特征 分类网络
2
一种梯级调控运行数据分析建模系统
建模系统 梯级 构建预测模型 调控策略 非线性
3
一种智能感应式近红外振动正畸加速器
子模块 红外照射 感应式 传感器模块 正畸治疗
4
一种ITSS运维资源配置优化方法及系统
网络节点模型 运维 资源优化配置 资源配置优化方法 节点资源状态
5
一种抗估计的Lorenz混沌衍生系统建立方法
系统建立方法 二进制伪随机序列 序列扩频通信 Chen混沌系统 系统抗干扰能力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号