摘要
本发明公开了一种基于循环神经网络的语音识别方法及系统,涉及语音识别技术领域,包括基于采集的原始语音信号进行预处理,获取带噪语音特征以及去噪语音特征,并构建语音判别向量模型;利用语音判别向量模型对所述去噪语音特征进行判别,得出去噪语音特征具有真实性的结果;根据所述语音判别向量模型得出的结果,决策是否输出为识别文本。本发明通过将带噪语音和去噪语音在特征空间中的欧几里得距离、余弦相似度以及信噪比差值进行整合,构建语音判别向量模型,对去噪语音的真实性进行判别,防止降噪处理后的语音与原始真实语音存在较大差异,避免识别文本失真较为严重,从而提高了语音识别的准确性。
技术关键词
语音特征
语音识别方法
信噪比差值
梅尔频率倒谱系数
带噪语音信号
文本
语音识别系统
语音识别技术
决策
判别模块
噪声功率
处理器
计算机设备
可读存储介质
分类器
存储器
系统为您推荐了相关专利信息
语音评价方法
特征提取模块
联合损失函数
语音音频数据
位置编码单元
物品查找方法
异常物品
三维地图数据
物品位置信息
语音特征数据
智能监测方法
语音特征数据
视觉特征
多模态数据采集
指标
时域特征
频域特征
智能语音控制器
带噪语音信号
语音识别方法