摘要
本发明实施例提供一种语音识别方法及系统,属于语音识别领域,该方法包括:通过待训练的特征提取模块自所述预处理样本语音内分别提取得到对应的样本语音特征向量,通过待训练的语音模块自所述样本语音特征向量内提取出特征表示和语音的时序依赖关系;将所述映射表示和所述语音的时序依赖关系输入待训练的语言模块,形成多个概率因素序列;针对每个概率因素序列将匹配程度最高的概率因素序列作为所述样本语音信号的语言文本并输出,直至输出的语言文本与样本语音信号对应的标记文本相符合,得到训练完毕的语音识别模型,所述语音识别模型用于接收待识别语音信号并输出对应的语言文本,提高语音识别精度和泛化能力。
技术关键词
时序依赖关系
语音识别方法
深度学习模型
语言模块
样本
语音识别模型
频谱特征
识别语音信号
特征提取模块
解码模块
文本
序列
时序特征
动态规划算法
注意力机制
梅尔频率倒谱系数
语音识别精度
存储计算机可执行指令
系统为您推荐了相关专利信息
毒品识别方法
神经网络识别模型
矩阵
偏最小二乘回归模型
数据
动植物食品
深度学习预测
多源异构数据
深度学习模型
注意力机制
岩性识别方法
金字塔池化模块
影像
卷积神经网络模型
全局平均池化