语音识别方法、装置、相关设备及计算机程序产品

正文

推荐专利

申请号：CN202510383600

申请日期：2025-03-28

公开号：CN120220663A

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开了一种语音识别方法、装置、相关设备及计算机程序产品，本申请所采用的语音识别模型包括共享编码器、支持流式解码处理的第一类解码器和支持非流式解码处理的第二类解码器，共享编码器采用同时支持流式和非流式识别任务的编码网络。待识别语音可以是流式识别任务中由音频块组成的语音数据流，也可以是非流式识别任务中的整段语音，由共享编码器对待识别语音的声学特征进行编码，编码特征送入目标解码器进行解码，基于解码结果得到最终语音识别结果。流式识别任务中目标解码器为第一类解码器，非流式识别任务中目标解码器为第二类解码器。本申请通过统一的语音识别模型，可以适应于流式识别任务及非流式识别任务，提高了使用的便捷性。

技术关键词

解码器编码特征语音识别模型语音识别方法声学特征编码器计算机程序产品语音识别装置特征提取单元多任务语种识别音频块处理器注意力机制可读存储介质网络

系统为您推荐了相关专利信息

一种基于预训练模型的招生智能问答系统

智能问答系统网络模块转换器预训练模型转换编码器

一种基于轻量化SAM的图像实例分割方法及装置

图像编码器图像实例分割方法解码器实例分割模型蒸馏方法

基于深度学习的攻击痕迹识别分析方法

识别分析方法时域特征频域特征指数痕迹特征

一种基于对比学习的天然气需求预测方法和系统

需求预测模型样本天然气预训练模型序列

基于记忆-边缘引导的弱监督视频显著性目标检测方法及系统

时空上下文信息记忆分支输入解码器门控结构

语音识别方法、装置、相关设备及计算机程序产品

站点导航

APP 下载