一种流式音频语种识别方法及系统

正文

推荐专利

一种流式音频语种识别方法及系统

申请号：CN202411918988

申请日期：2024-12-25

公开号：CN119811383B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开的一种流式音频语种识别方法及系统，属于语种识别技术领域。本发明实现方法为：1、利用语音活性检测方法对原始音频数据进行预处理，得到语种识别训练数据；2、对语种识别训练数据进行特征提取；3、构建编码器解码器模型并进行语种识别特征训练；4、将语种识别测试数据输入至已训练的编码器解码器模型获得语种识别音频数据，将语种识别音频数据以数据累积的方式形成音频数据流；5、利用语音活性检测方法对音频数据流进行活性检测；6、对通过活性检测的音频数据进行窗级别的语种判别；具体的，通过当前窗与上一窗的音频数据对比，进而获得当前状态的时间戳和语种结果；与现有技术相比，本发明在流式场景中实现多语种混合语音识别。

技术关键词

语种识别方法编码器解码器语音活性检测方法音频编码器参数数据语种识别系统语种识别技术混合语音识别傅里叶变换方法频域特征模块时域特征滤波器滑动窗口

系统为您推荐了相关专利信息

带有智能语音测验模块的英语口语学习装置

英语口语学习装置智能语音移动网络安全认证移动通信模块蓝牙模块

一种多模态时序对齐AI视频翻译方法、系统

视频翻译方法多模态时序双语字幕声纹特征

热轧板坯切头尾掉落多模态检测方法及系统

多模态检测系统热轧板投票算法落料深度学习模型

对象处理方法、装置、电子设备、存储介质及程序产品

AI助手对象模块界面标识

一种基于AI的健康管理方法及系统

计划健康管理方法数据身体健康管理系统

一种流式音频语种识别方法及系统

站点导航

APP 下载