基于深度学习的多语种实时语音识别系统及方法

正文

推荐专利

申请号：CN202510030244

申请日期：2025-01-08

公开号：CN119418705A

公开日期：2025-02-11

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体涉及基于深度学习的多语种实时语音识别系统及方法。该方法包括：将待识别语音信号输入到维纳滤波模型中，输出增强后的语音信号；利用一组在频率上均匀分布的三角带通滤波器对离散能量谱进行处理，从而获得相应的输出，对所有滤波器的输出做对数运算，求得对数功率谱，并基于对数功率谱离散余弦变换得到语音信号的特征参数，基于特征参数提取语音信号特征矢量；将语音信号特征矢量输入到矢量量化器中，输出量化形成的码矢标号，并将码矢标号输入到HMM语音识别模型中，输出识别结果。本发明能够提高语音识别的准确性，提高实时语音识别服务的稳定性。

技术关键词

识别语音信号语音信号特征实时语音语音识别模型识别系统三角带滤波器离散余弦变换信号特征提取特征参数提取矢量量化噪声语音 Viterbi算法 Welch算法频率功率 HMM模型语音识别技术

系统为您推荐了相关专利信息

一种语音辅助阅卷的声音智能识别方法及系统

语音智能识别方法端点检测算法信号周期

一种碳纤维扫描电子显微镜截面图像自动识别方法及系统

图像自动识别方法扫描电子显微镜残差神经网络神经网络模型图像自动识别系统

一种基于毫米波雷达的时空融合人体姿态识别系统及方法

人体姿态识别系统中频信号 Chirp信号调频连续波信号点云

基于时间切片结合模式识别的长时段连续移动冲击载荷识别方法及其系统

冲击载荷识别方法切片正则化方法模式识别方法特征值

融合GMM与自适应阈值分割的空调管道霉斑面积识别方法

识别方法壁面管道空调自动识别系统

基于深度学习的多语种实时语音识别系统及方法

站点导航

APP 下载