一种语音识别方法及相关装置、设备和存储介质

正文

推荐专利

申请号：CN202411007495

申请日期：2024-07-25

公开号：CN118982986A

公开日期：2024-11-19

类型：发明专利

摘要

本申请公开了一种语音识别方法及相关装置、设备和存储介质，其中，语音识别方法包括：基于待识别语音的语音特征，得到声学编码特征、帧级发音特征和段级发音特征；基于声学编码特征进行预测，得到待识别语音的预测发音序列，并基于预测发音序列，提取得到文本编码特征；获取声学编码特征与帧级发音特征的第一融合特征，并获取文本编码特征与段级发音特征的第二融合特征；基于第一融合特征和第二融合特征进行解码，得到待识别语音的语音识别文本。上述方案，能够提升语音识别的准确性。

技术关键词

编码特征发音特征融合特征语音识别模型样本语音识别文本语音识别方法序列语音特征解码模型度量嵌入特征交叉注意力机制元素语音识别装置

系统为您推荐了相关专利信息

基于自监督对比学习的数字电网资产分类与演化监控方法、系统、设备及存储介质

监控方法网络流量数据滑动时间窗口序列电网智能化技术

基于约束贝叶斯推理的水电高边坡响应更新方法及装置

高边坡更新方法抽样算法水电站样本

人脸部位分类方法、系统、设备及存储介质

人脸模型分类方法人脸图像数据分类程序样本

一种基于深度学习的数据处理方法及系统

网络流量分类模型数据处理方法分类模型训练实时数据采集深度学习算法

一种基于宏基因组学标志物用于水中尸体法医学鉴定的方法及应用

细菌检测试剂生物标志物豚鼠气单胞菌原始测序数据随机森林

一种语音识别方法及相关装置、设备和存储介质

站点导航

APP 下载