基于多配置分块上下文转换器模型的语音识别方法及装置

AITNT
正文
推荐专利
基于多配置分块上下文转换器模型的语音识别方法及装置
申请号:CN202510027286
申请日期:2025-01-08
公开号:CN119446125B
公开日期:2025-04-29
类型:发明专利
摘要
本发明提供一种基于多配置分块上下文转换器模型的语音识别方法及装置,属于人工智能技术领域,该方法包括:获取待识别语音的特征序列;将特征序列输入至经过训练的语音识别模型,利用语音识别模型对待识别语音进行语音识别,得到语音识别模型输出的识别结果;语音识别模型为多配置分块上下文转换器MCC‑Transformer模型,MCC‑Transformer模型是在转换器模型的基础上,在编码器中引入一个语音MCC‑Transformer块构建而成,语音MCC‑Transformer块由多个MCC‑Transformer块堆叠而成。本发明在编码器中引入一个由多个MCC‑Transformer块堆叠而成的语音MCC‑Transformer块,提高了语音识别的准确率。
技术关键词
语音识别模型 语音识别方法 分块 转换器 注意力 解码器 机制 编码器 非暂态计算机可读存储介质 序列 文本 语音识别装置 级联 处理器 人工智能技术 计算机程序产品 识别模块 基础
系统为您推荐了相关专利信息
1
一种药靶互作预测模型的表征优化与软标签构建方法
标签构建方法 样本 标签构建系统 药物虚拟筛选 冗余
2
一种黄铁矿SEM图像分割方法及装置
图像分割模型 图像分割方法 黄铁矿 边界特征 补丁
3
基于深度感知的隐藏目标检测方法
多模态信息融合 解码器 深度相机 sigmoid函数 场景
4
电子显微成像自动对焦方法、装置、设备、介质和产品
图像 分类网络 待测对象 神经网络模型 参数
5
少样本三元组抽取方法、系统、计算机设备及存储介质
三元组 原型 关系 实体 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号