语音识别引擎的切换方法、语种识别模型的训练方法、装置、计算机设备、存储介质和计算机程序产品

正文

推荐专利

申请号：CN202510370635

申请日期：2025-03-26

公开号：CN120260606A

公开日期：2025-07-04

类型：发明专利

摘要

本申请涉及一种语音识别引擎的切换方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：采用当前语音识别引擎对待识别音频流进行识别，将待识别音频流中各音频帧的音频特征输入至语种识别模型，得到各音频窗口属于预设语种的概率；在连续的第一预设数量个音频窗口中，确定目标音频窗口的数量；在目标音频窗口的数量大于或等于第二预设数量时，确定待识别音频流属于预设语种，将预设语种对应的语音识别引擎确定为目标语音识别引擎；在目标语音识别引擎与当前语音识别引擎不一致时，将当前语音识别引擎切换为目标语音识别引擎，通过目标语音识别引擎对待识别音频流进行识别。采用本方法能够提高多语种语音交互场景的语音识别效果。

技术关键词

语音识别引擎识别音频流语种识别音频特征分类网络训练样本集计算机程序产品门控循环单元切换方法计算机设备多语种语音标签处理器切换装置输入模块可读存储介质

系统为您推荐了相关专利信息

一种实时个性化交互系统

个性化交互系统语音识别引擎语言模块网络路径优化图像采集模块

一种景区互动仿真机器人

仿真机器人中央控制单元仿真人肢体动作控制深度学习模型

一种基于像素流云渲染的数字人交互方法、系统及介质

人交互方法通道像素卷积神经网络识别建立人脸模型

语音交互、模型训练方法、装置、设备及产品

样本信号音频特征滑动窗口模型训练方法

基于微服务架构的高速公路收费稽核系统及方法

逃费车辆微服务架构筛查模型车辆重识别模型稽核系统

语音识别引擎的切换方法、语种识别模型的训练方法、装置、计算机设备、存储介质和计算机程序产品

站点导航

APP 下载