摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征
发音特征
融合特征
语音识别模型
样本
语音识别文本
语音识别方法
序列
语音特征
解码模型
度量
嵌入特征
交叉注意力机制
元素
语音识别装置
系统为您推荐了相关专利信息
监控方法
网络流量数据
滑动时间窗口
序列
电网智能化技术
网络流量分类模型
数据处理方法
分类模型训练
实时数据采集
深度学习算法
细菌检测试剂
生物标志物
豚鼠气单胞菌
原始测序数据
随机森林