基于多配置分块上下文转换器模型的语音识别方法及装置

正文

推荐专利

申请号：CN202510027286

申请日期：2025-01-08

公开号：CN119446125B

公开日期：2025-04-29

类型：发明专利

摘要

本发明提供一种基于多配置分块上下文转换器模型的语音识别方法及装置，属于人工智能技术领域，该方法包括：获取待识别语音的特征序列；将特征序列输入至经过训练的语音识别模型，利用语音识别模型对待识别语音进行语音识别，得到语音识别模型输出的识别结果；语音识别模型为多配置分块上下文转换器MCC‑Transformer模型，MCC‑Transformer模型是在转换器模型的基础上，在编码器中引入一个语音MCC‑Transformer块构建而成，语音MCC‑Transformer块由多个MCC‑Transformer块堆叠而成。本发明在编码器中引入一个由多个MCC‑Transformer块堆叠而成的语音MCC‑Transformer块，提高了语音识别的准确率。

技术关键词

语音识别模型语音识别方法分块转换器注意力解码器机制编码器非暂态计算机可读存储介质序列文本语音识别装置级联处理器人工智能技术计算机程序产品识别模块基础

系统为您推荐了相关专利信息

一种药靶互作预测模型的表征优化与软标签构建方法

标签构建方法样本标签构建系统药物虚拟筛选冗余

一种黄铁矿SEM图像分割方法及装置

图像分割模型图像分割方法黄铁矿边界特征补丁

基于深度感知的隐藏目标检测方法

多模态信息融合解码器深度相机 sigmoid函数场景

电子显微成像自动对焦方法、装置、设备、介质和产品

图像分类网络待测对象神经网络模型参数

少样本三元组抽取方法、系统、计算机设备及存储介质

三元组原型关系实体样本

基于多配置分块上下文转换器模型的语音识别方法及装置

站点导航

APP 下载