基于多尺度残差卷积和Longformer的语音识别方法

AITNT
正文
推荐专利
基于多尺度残差卷积和Longformer的语音识别方法
申请号:CN202411612729
申请日期:2024-11-13
公开号:CN119541460A
公开日期:2025-02-28
类型:发明专利
摘要
本发明涉及语音识别技术领域,尤其涉及一种基于多尺度残差卷积和Longformer的语音识别方法,包括:S1、对预先获取的语音信号进行预处理得到相应的声学信号;S2、将所述声学信号输入至训练的语音识别模型,得到与所述语音信号对应的语音文本;其中,训练的语音识别模型是采用训练数据集对预先创建的语音识别模型进行训练得到的;所述训练数据集包括:多段第一声学信号以及分别与每一段第一声学信号一一对应的预先标注的语音文本;多段第一声学信号是由预先获取的用于训练的多段语音信号分别进行预处理得到的;所述语音识别模型是由多尺度残差卷积神经网络和longformer模型构建的。
技术关键词
语音识别模型 残差卷积神经网络 语音识别方法 多尺度 积层 信号 输出特征 分支 文本 语音识别技术 解码器 编码器 数据 基础 算法 参数
系统为您推荐了相关专利信息
1
多尺度数据处理方法、装置、设备、存储介质及程序产品
多尺度 数据处理方法 频率 神经网络模型 图像识别模型
2
用于多源异构数据的多粒度提取与增强方法、装置及设备
多源异构数据 底层融合特征 多模态特征 多层次特征提取 序列
3
一种基于多层激活响应融合深度神经网络的器官超声图像质量评价方法及系统
融合深度神经网络 深度神经网络模型 评价方法 融合多尺度特征 热力图
4
一种储能测试系统及方法
电能监测数据 故障注入模块 数据分析模块 电化学阻抗谱 模拟电网故障
5
一种基于交叉小波相干分析的中低压配电网故障在线检测方法
低压配电网故障 在线检测方法 线路零序电流 滑动窗口 GMM模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号