语音识别引擎的切换方法、语种识别模型的训练方法、装置、计算机设备、存储介质和计算机程序产品

AITNT
正文
推荐专利
语音识别引擎的切换方法、语种识别模型的训练方法、装置、计算机设备、存储介质和计算机程序产品
申请号:CN202510370635
申请日期:2025-03-26
公开号:CN120260606A
公开日期:2025-07-04
类型:发明专利
摘要
本申请涉及一种语音识别引擎的切换方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:采用当前语音识别引擎对待识别音频流进行识别,将待识别音频流中各音频帧的音频特征输入至语种识别模型,得到各音频窗口属于预设语种的概率;在连续的第一预设数量个音频窗口中,确定目标音频窗口的数量;在目标音频窗口的数量大于或等于第二预设数量时,确定待识别音频流属于预设语种,将预设语种对应的语音识别引擎确定为目标语音识别引擎;在目标语音识别引擎与当前语音识别引擎不一致时,将当前语音识别引擎切换为目标语音识别引擎,通过目标语音识别引擎对待识别音频流进行识别。采用本方法能够提高多语种语音交互场景的语音识别效果。
技术关键词
语音识别引擎 识别音频流 语种识别 音频特征 分类网络 训练样本集 计算机程序产品 门控循环单元 切换方法 计算机设备 多语种语音 标签 处理器 切换装置 输入模块 可读存储介质
系统为您推荐了相关专利信息
1
一种实时个性化交互系统
个性化交互系统 语音识别引擎 语言模块 网络路径优化 图像采集模块
2
一种景区互动仿真机器人
仿真机器人 中央控制单元 仿真人 肢体动作控制 深度学习模型
3
一种基于像素流云渲染的数字人交互方法、系统及介质
人交互方法 通道 像素 卷积神经网络识别 建立人脸模型
4
语音交互、模型训练方法、装置、设备及产品
样本 信号 音频特征 滑动窗口 模型训练方法
5
基于微服务架构的高速公路收费稽核系统及方法
逃费车辆 微服务架构 筛查模型 车辆重识别模型 稽核系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号