摘要
本发明提供一种语音识别方法、装置、存储介质及电子设备,该方法包括:调用目标预训练模型,对目标语音数据进行特征提取,得到目标语音数据中每个目标语音帧的语音特征;基于每个目标语音帧的语音特征,对目标语音数据进行聚类处理,得到多个聚类语音特征,以确定至少一个文本识别结果;当目标语音数据满足流式音频数据识别条件时,基于多个聚类语音特征和至少一个文本识别结果,确定目标语音数据下的音频数据表示特征;调用目标注意力模型,基于目标语音数据下的音频数据表示特征,确定至少一个文本识别结果中每个文本识别结果的解码特征,从而确定目标语音数据的目标语音识别结果。本发明实施例可快速地对目标语音数据进行语音识别。
技术关键词
语音特征
音频
预训练模型
数据
文本识别
注意力模型
标签文本
聚类
语音识别方法
嵌入特征
解码
处理单元
语音识别装置
电子设备
计算机
处理器
指令
关系
系统为您推荐了相关专利信息
数据采集频率
围岩变形监测
实时监测数据
监测点
动态时间规整算法
并行加速方法
多项式乘法
数据并行计算
客户端
私钥
测试点
距离估计
RSSI数据
距离信息
定位方法