语音数据处理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510057801

申请日期：2025-01-14

公开号：CN119495294A

公开日期：2025-02-21

类型：发明专利

摘要

本申请实施例提出的语音数据处理方法、装置、电子设备及存储介质，方法包括：首先，响应于语音数据任务的数据处理，对待处理语音数据进行特征提取，得到语音嵌入向量；然后，获取语音数据任务对应的预设偏置列表，并基于预设偏置列表得到预设词组索引词典；之后，将语音嵌入向量进行解码过滤处理，得到包含至少一个罕见文本词汇的过滤文本序列，并基于预设词组索引词典和过滤文本序列生成罕见词汇嵌入向量；接着，将语音嵌入向量和罕见词汇嵌入向量进行拼接处理得到语音处理向量；最后，将语音处理向量输入大语言处理模型进行数据处理，得到待处理语音数据的目标文本序列，有效地提高了此次上下文语音识别的精准性。

技术关键词

语音数据处理方法语音特征提取文本索引词典序列上下文语音识别语音数据处理装置列表解码电子设备样本特征提取模块数据处理模块拼接模块处理器字符

语音数据处理方法、装置、电子设备及存储介质

站点导航

APP 下载