摘要
本申请涉及一种语音识别引擎的切换方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:采用当前语音识别引擎对待识别音频流进行识别,将待识别音频流中各音频帧的音频特征输入至语种识别模型,得到各音频窗口属于预设语种的概率;在连续的第一预设数量个音频窗口中,确定目标音频窗口的数量;在目标音频窗口的数量大于或等于第二预设数量时,确定待识别音频流属于预设语种,将预设语种对应的语音识别引擎确定为目标语音识别引擎;在目标语音识别引擎与当前语音识别引擎不一致时,将当前语音识别引擎切换为目标语音识别引擎,通过目标语音识别引擎对待识别音频流进行识别。采用本方法能够提高多语种语音交互场景的语音识别效果。
技术关键词
语音识别引擎
识别音频流
语种识别
音频特征
分类网络
训练样本集
计算机程序产品
门控循环单元
切换方法
计算机设备
多语种语音
标签
处理器
切换装置
输入模块
可读存储介质
系统为您推荐了相关专利信息
个性化交互系统
语音识别引擎
语言模块
网络路径优化
图像采集模块
仿真机器人
中央控制单元
仿真人
肢体动作控制
深度学习模型
人交互方法
通道
像素
卷积神经网络识别
建立人脸模型
逃费车辆
微服务架构
筛查模型
车辆重识别模型
稽核系统