语音识别方法、装置、存储介质和程序产品

正文

推荐专利

语音识别方法、装置、存储介质和程序产品

申请号：CN202510315287

申请日期：2025-03-17

公开号：CN120340459A

公开日期：2025-07-18

类型：发明专利

摘要

本申请公开了一种语音识别方法、装置、存储介质和程序产品，涉及人工智能技术领域，包括：通过前置的音频分类模型先识别待识别音频信号的目标语言类型，在识别语言类型的过程中，音频分类模型提取待识别音频信号的局部特征，并捕获待识别音频信号的全局特征，二者融合得到融合语音特征，克服了卷积神经网络在处理序列数据时的局限性，同时也弥补了局部信息，从而更准确地确定待识别音频信号的语言类型；多语言识别模型根据音频分类模型提供的目标语言类型，智能地选择最适宜的语言识别规则对待识别音频信号进行处理，解决了多语言识别模型在处理具有相似特征的语言时识别准确率低的问题，提高了语音识别的准确性和可靠性。

技术关键词

语音识别方法音频注意力输出特征前馈神经网络信号语音特征多语言残差网络特征融合网络编码块变换器语音采集模块语音识别装置元素可读存储介质文本人工智能技术

语音识别方法、装置、存储介质和程序产品

站点导航

APP 下载