摘要
本申请提供一种语音识别的方法、服务器、存储介质和程序产品。本申请的方法,在对语音数据进行语音识别时,通过语音识别模型提取语音数据的语音特征,对语音特征进行CTC处理,实现语音与文本的对齐,生成一个初步的文本序列预测结果,该初步的文本序列预测结果的长度也即是最终语音识别结果的长度;进一步地,根据初步的文本序列预测结果和语音特征,解码生成语音数据的语音识别结果,实现非自回归的语音识别,通过一步解码即可生成最终的语音识别结果,大大节省了解码输出语音识别结果的时间开销,提升了语音识别的速度和效率,并且可以取得较高的识别准确率。
技术关键词
语音特征
语音识别模型
文本
样本
时序
序列
声学特征
标记
数据
语音识别方法
计算机执行指令
后处理模块
特征提取模块
解码模块
编码模块
服务器
处理器
可读存储介质
系统为您推荐了相关专利信息
胎儿心脏
超声影像数据
图像半监督分类
融合特征
误差