基于元数据增强的语音识别模型预训练方法、语音识别方法及系统

正文

推荐专利

申请号：CN202510356445

申请日期：2025-03-25

公开号：CN120260548A

公开日期：2025-07-04

类型：发明专利

摘要

本发明涉及语音识别技术，提供一种基于元数据增强的语音识别模型预训练方法、语音识别方法及系统。其中语音识别模型预训练方法包括：获取语音识别数据集，所述语音识别数据集由不同语种的语音‑文本对组成，从所述语音识别数据集中N种语种中采样N个任务以形成批次数据集，将所述批次数据集中的每个任务分为支持集和查询集；基于所述批次数据集对语音识别模型进行元训练，提取训练过程中在所述语音识别模型的指定隐藏层中的批次数据集并进行数据扰动，得到扰动数据集；对应的，所述扰动数据集中每个任务包含扰动支持集和扰动查询集；将所述批次数据集和所述扰动数据集进行混合增强后对每个语种进行训练并更新所述语音识别模型参数。

技术关键词

语音识别模型预训练方法数据编码器适配器语音识别方法文本语音特征参数语音识别系统语音识别技术语音识别模块模型训练模块样本处理器存储器非线性电子设备

系统为您推荐了相关专利信息

芯片、数据缓冲电路及其控制方法

缓冲电路闪存阵列写入驱动器灵敏放大器译码

内容推荐模型训练方法、内容推荐方法、装置和电子设备

内容推荐模型样本集群内容推荐方法账户

一种太阳能网板的分区划分方法、终端、介质及产品

分区划分方法图形处理标识计算机程序代码激光

一种海洋环境钢结构涂层防腐性能测试分析方法

性能测试分析方法涂层性能测试数据钢结构海洋环境数据

一种在车辆行驶过程中预测违章风险的方法

决策树模型 CART决策树车辆风险机器学习训练

基于元数据增强的语音识别模型预训练方法、语音识别方法及系统

站点导航

APP 下载