语音识别方法、装置、存储介质及电子设备

正文

推荐专利

语音识别方法、装置、存储介质及电子设备

申请号：CN202411575360

申请日期：2024-11-06

公开号：CN119600994A

公开日期：2025-03-11

类型：发明专利

摘要

本发明提供一种语音识别方法、装置、存储介质及电子设备，该方法包括：调用目标预训练模型，对目标语音数据进行特征提取，得到目标语音数据中每个目标语音帧的语音特征；基于每个目标语音帧的语音特征，对目标语音数据进行聚类处理，得到多个聚类语音特征，以确定至少一个文本识别结果；当目标语音数据满足流式音频数据识别条件时，基于多个聚类语音特征和至少一个文本识别结果，确定目标语音数据下的音频数据表示特征；调用目标注意力模型，基于目标语音数据下的音频数据表示特征，确定至少一个文本识别结果中每个文本识别结果的解码特征，从而确定目标语音数据的目标语音识别结果。本发明实施例可快速地对目标语音数据进行语音识别。

技术关键词

语音特征音频预训练模型数据文本识别注意力模型标签文本聚类语音识别方法嵌入特征解码处理单元语音识别装置电子设备计算机处理器指令关系

系统为您推荐了相关专利信息

基于实时监控的流式计算任务智能运维方法

智能运维方法节点集中度指数检查点

一种实时围岩变形监测与数据采集方法及系统

数据采集频率围岩变形监测实时监测数据监测点动态时间规整算法

一种基于GPU的后量子密码BIKE高性能并行加速方法

并行加速方法多项式乘法数据并行计算客户端私钥

一种基于稳健测距模型的自适应Wi-Fi定位方法

测试点距离估计 RSSI数据距离信息定位方法

一种卡车锂电池数据通信的安全加密方法

锂电池设备手持终端数据通信加密方法卡车

语音识别方法、装置、存储介质及电子设备

站点导航

APP 下载