基于深度学习的多语种实时语音识别系统及方法

AITNT
正文
推荐专利
基于深度学习的多语种实时语音识别系统及方法
申请号:CN202510030244
申请日期:2025-01-08
公开号:CN119418705A
公开日期:2025-02-11
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体涉及基于深度学习的多语种实时语音识别系统及方法。该方法包括:将待识别语音信号输入到维纳滤波模型中,输出增强后的语音信号;利用一组在频率上均匀分布的三角带通滤波器对离散能量谱进行处理,从而获得相应的输出,对所有滤波器的输出做对数运算,求得对数功率谱,并基于对数功率谱离散余弦变换得到语音信号的特征参数,基于特征参数提取语音信号特征矢量;将语音信号特征矢量输入到矢量量化器中,输出量化形成的码矢标号,并将码矢标号输入到HMM语音识别模型中,输出识别结果。本发明能够提高语音识别的准确性,提高实时语音识别服务的稳定性。
技术关键词
识别语音信号 语音信号特征 实时语音 语音识别模型 识别系统 三角带 滤波器 离散余弦变换 信号特征提取 特征参数提取 矢量量化 噪声语音 Viterbi算法 Welch算法 频率 功率 HMM模型 语音识别技术
系统为您推荐了相关专利信息
1
一种语音辅助阅卷的声音智能识别方法及系统
语音 智能识别方法 端点检测算法 信号 周期
2
一种碳纤维扫描电子显微镜截面图像自动识别方法及系统
图像自动识别方法 扫描电子显微镜 残差神经网络 神经网络模型 图像自动识别系统
3
一种基于毫米波雷达的时空融合人体姿态识别系统及方法
人体姿态识别系统 中频信号 Chirp信号 调频连续波信号 点云
4
基于时间切片结合模式识别的长时段连续移动冲击载荷识别方法及其系统
冲击载荷识别方法 切片 正则化方法 模式识别方法 特征值
5
融合GMM与自适应阈值分割的空调管道霉斑面积识别方法
识别方法 壁面 管道 空调 自动识别系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号