摘要
本发明涉及语音识别技术领域,具体涉及基于深度学习的多语种实时语音识别系统及方法。该方法包括:将待识别语音信号输入到维纳滤波模型中,输出增强后的语音信号;利用一组在频率上均匀分布的三角带通滤波器对离散能量谱进行处理,从而获得相应的输出,对所有滤波器的输出做对数运算,求得对数功率谱,并基于对数功率谱离散余弦变换得到语音信号的特征参数,基于特征参数提取语音信号特征矢量;将语音信号特征矢量输入到矢量量化器中,输出量化形成的码矢标号,并将码矢标号输入到HMM语音识别模型中,输出识别结果。本发明能够提高语音识别的准确性,提高实时语音识别服务的稳定性。
技术关键词
识别语音信号
语音信号特征
实时语音
语音识别模型
识别系统
三角带
滤波器
离散余弦变换
信号特征提取
特征参数提取
矢量量化
噪声语音
Viterbi算法
Welch算法
频率
功率
HMM模型
语音识别技术
系统为您推荐了相关专利信息
图像自动识别方法
扫描电子显微镜
残差神经网络
神经网络模型
图像自动识别系统
人体姿态识别系统
中频信号
Chirp信号
调频连续波信号
点云
冲击载荷识别方法
切片
正则化方法
模式识别方法
特征值